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Zusammenfassung 


Das lern- und leistungsbezogene Feedback, das Schülerinnen und Schüler im Un- 
terricht von ihrer Lehrkraft erhalten, stellt ein wichtiges Merkmal eines guten Un- 
terrichts und eines qualitätsvollen Unterrichtsgesprächs dar. Empirische For- 
schungsbefunde zeigen, dass sich das Feedback der Lehrkraft nicht zwangsläufig 
— oder bei allen gleichermaßen — förderlich auf den Lernprozess auswirkt, sondern 
erst dadurch, dass Lernende in Abhängigkeit ihrer individuellen Lernvoraussetzun- 
gen das Feedback subjektiv wahrnehmen und zur Verbesserung ihres Lernprozes- 
ses nutzen. Angesichts dieser differenziellen Wirkung von Feedback rücken neuere 
Untersuchungen vermehrt die Schülerinnen und Schüler und ihre subjektive Wahr- 
nehmung des im Unterricht erteilten Feedbacks ins Zentrum des Interesses. An 
diese Forschungslage knüpft die vorliegende Studie an, deren übergreifendes Ziel 
es ist, die Wahrnehmung von Feedback aus der Sicht von Schülerinnen und Schü- 
lern im Deutschunterricht der gymnasialen Oberstufe differenziert zu analysieren. 
Ausgehend von den Annahmen theoretischer Angebots-Nutzungs-Modelle steht 
die Frage im Mittelpunkt, inwiefern Feedback als Qualitätsmerkmal von Unterricht 
in Abhängigkeit der individuellen Merkmale von Schülerinnen und Schülern diffe- 
renziell wahrgenommen wird und wie die wahrgenommene Feedbackqualität mit 
der Motivationsentwicklung zusammenhängt. 

Zur Beantwortung der Fragestellungen wurden im Rahmen der Längsschnitt- 
studie FeeHe 807 Schülerinnen und Schüler in 49 Deutschkursen der gymnasialen 
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Oberstufe standardisiert zu ihrer Wahrnehmung verschiedener Dimensionen der 
Feedbackqualität sowie zu ihrer Lernmotivation befragt. Die Befunde der Latent- 
True-Change-Analysen zeigen, dass sich die Schülerinnen und Schüler im Deutsch- 
unterricht der gymnasialen Oberstufe nicht nur bedeutsam in der Wahrnehmung 
von Feedback zu Beginn des Schuljahres, sondern auch in ihrer Wahrnehmungs- 
veränderung im Verlauf des Schulhalbjahres unterscheiden. Dabei erweist sich die 
Vorleistung als prädiktiv für interindividuelle Unterschiede in der Wahrnehmung 
der Feedbackqualität. Die Befunde aus bivariaten Latent-True-Change-Modellen 
belegen positive Korrelationen zwischen der wahrgenommenen Feedbackqualität 
und der Ausgangsmotivation der Schülerinnen und Schüler zu Beginn des Schul- 
jahres. Ebenso stehen die Veränderungen der Feedbackwahrnehmung und der 
intrinsischen Motivation im Laufe des Schulhalbjahres in einem positiven Zusam- 
menhang. Mediationsanalysen weisen nach, dass sowohl die wahrgenommene 
Nützlichkeit von Feedback als auch das subjektive Kompetenzerleben, die als 
Merkmale der Nutzung von Feedback konzeptualisiert werden, den Zusammen- 
hang zwischen Dimensionen der wahrgenommenen Feedbackqualität und der Mo- 
tivationsveränderung der Schülerinnen und Schüler erklären können. 

Insgesamt erweitert die vorliegende Untersuchung den bestehenden For- 
schungsstand zu interindividuellen Unterschieden in der Wahrnehmung von Feed- 
back und der Entstehung differenzieller Wirkungen auf die Motivation, womit auch 
ein Beitrag zur Überprüfung zentraler Annahmen von Angebots-Nutzungs-Model- 
len geleistet werden soll. 


Abstract 


Feedback that students receive from their teacher during class is considered a key 
factor of effective teaching and classroom discourse. However, empirical findings 
show that the impact of teacher feedback on the learning process is not necessarily 
positive, indicating that learners perceive and use feedback differently depending 
on their individual learning characteristics. Against this background, students’ indi- 
vidual perception of feedback in classroom has been the focus of much recent re- 
search. Taking their findings into account, the present study aims to investigate the 
perception of feedback from the perspective of students in German language clas- 
ses in upper secondary schools. Based on theoretical assumptions of supply-use 
models, the focus of this study is on the extent to which feedback quality is per- 
ceived differently depending on the individual characteristics of the students and in 
how far the perceived feedback quality is related to the development of motivation. 

The analyses are based on data from the longitudinal study “FeeHe”, in which 
807 students from 49 German language classes in upper secondary school were 
surveyed about their perception of different dimensions of feedback quality as well 
as their learning motivation. Results of latent change models show that students in 
German lessons in upper secondary school not only differ significantly in their per- 
ception of feedback at the beginning of the school year, but also in their changes of 
perception over the course of a school semester. Students’ individual performance 
predicts interindividual changes in the perception of feedback quality. Findings 
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from bivariate latent change models show that the level and change in perceived 
feedback quality and in students’ motivation are positively related. Further analyses 
indicate that both the perceived usefulness of feedback and the perceived compe- 
tence support mediate the link between dimensions of perceived feedback quality 
and change in students’ motivation. 

Overall, the present study expands the current state of research on interindivid- 
ual differences in the perception of feedback and on differences in the effects of 
feedback on motivation. 
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1 Einleitung 


1.1 Ausgangslage 


Die Qualität schulischer Lernprozesse hängt in hohem Maße von individuellen 
Merkmalen der einzelnen Schülerinnen und Schüler ab (Buff et al., 2010; Helmke, 
2015; Seidel et al., 2016). In Wechselwirkung mit Merkmalen der Lernsituation be- 
einflussen diese die Wahrnehmung des Unterrichtsgeschehens und vermittelt dar- 
über den Lernerfolg (Buff et al., 2010). Ausgehend von diesen theoretischen An- 
nahmen werden in empirischen Studien der Unterrichtsforschung zunehmend diffe- 
renzielle Analyseansätze genutzt, indem individuelle Wahrnehmungsprozesse und 
Lernvoraussetzungen von Schülerinnen und Schülern bei der Beschreibung der Un- 
terrichtsqualität und -wirkungen stärker als bisher einbezogen werden (Igler et al., 
2019; Jurik et al., 2015; Stang & McElvany, 2020; Willems, 2022a; Willems & Drei- 
ling, 2022). Dabei wird angenommen, dass aufgrund der unterschiedlichen Voraus- 
setzungen von Schülerinnen und Schülern sogenannte „Mikro-Umwelten“ in Klas- 
senzimmern entstehen (Seidel et al. 2016, S. 65; vgl. auch Jurik et al., 2015; Seidel, 
2006; Willems, 20222; Willems & Dreiling, 2022), die zu differenziellen Wahrneh- 
mungsprozessen zwischen den Schülerinnen und Schülern innerhalb des gleichen 
Unterrichts führen. Das Zusammenspiel des Unterrichts und den Merkmalen der 
Schülerinnen und Schüler wird auch in theoretischen Angebots-Nutzungs-Model- 
len veranschaulicht (z.B. Helmke, 2015; Seidel, 2014; Vieluf et al., 2020). Der Kern- 
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gedanke des Modells ist, dass der schulische Lernerfolg nicht nur von der Gestal- 
tung des Lernangebots, sondern im Wesentlichen auch von dessen Wahrnehmung 
und Nutzung durch die Schülerinnen und Schüler abhängt. Im Rahmen dieses For- 
schungsansatzes werden Unterrichtsmerkmale daher häufig aus der Perspektive von 
Schülerinnen und Schülern erfasst. Deren Einschätzungen haben sich als prädiktiv 
für die Vorhersage kognitiver und motivational-affektiver Lernergebnisse erwiesen 
(Clausen, 2002; Fauth et al., 2014; Kunter et al., 2007; Stahns et al., 2020; Wagner 
et al., 2016). 

Ein Merkmal des Unterrichtsangebots, das aufgrund seiner lernförderlichen 
Wirkungen immer wieder im Fokus der Forschung steht, ist das Feedback der Lehr- 
kraft (Hattie, 2009; Hattie & Timperley, 2007; Lipnevich & Smith, 2018). Im Kon- 
text des Schulunterrichts wird Feedback häufig im Anschluss an die Aufgabenbear- 
beitung oder eine Antwort bereitgestellt. Es informiert Lernende über die Qualität 
ihrer Aufgabenbearbeitung bzw. ihrer Antwort (Lipowsky, 2020). Die Bedeutsam- 
keit von Feedback für den allgemeinen Lernerfolg konnte anhand von Meta-Ana- 
lysen und Reviews demonstriert werden (Hattie, 2009; Hattie & Zierer, 2019; Klu- 
ger & DeNisi, 1996; Wisniewski et al., 2020). In ihrem Review berichten Hattie und 
Timperley (2007), dass Feedback zu den lernwirksamsten Faktoren im Unterricht 
gehört. Die Ergebnisse einer kürzlich durchgeführten Meta-Analyse (Wisniewski et 
al., 2020) deuten auf einen mittleren Effekt von Feedback auf das Lernen der Schü- 
lerinnen und Schüler hin. Allerdings wird die Wirkung von Feedback wesentlich 
davon beeinflusst, welche Form von Feedback vermittelt wird (Wisniewski et al., 
2020). Im Hinblick auf die Gestaltung gilt Feedback dann als besonders förderlich, 
wenn es Informationen über das Zie/ oder das Ergebnis einer Aufgabenbearbeitung, 
Hinweise zum Prozess der Aufgabenbearbeitung sowie Impulse zur Se/bstregulation 
enthält (Hattie & Timperley, 2007). Im Sinne der Förderung einer ko-konstruktiven 
Wissenskonstruktion (Lipowsky, 2020; Pauli & Reusser, 2018) sollte Feedback im 
Unterricht auch zum gegenseitigen Austausch bzw. Dialog zwischen den Schülerin- 
nen und Schülern anregen (Willems & Dreiling, 2022). 

Vor dem Hintergrund der differenziellen Effekte von Feedback richtet die For- 
schung zunehmend ihren Blick auf Merkmale von Schülerinnen und Schülern, die 
die Wirksamkeit von Feedback beeinflussen. Auf Basis von Angebots-Nutzungs- 
Modellen wird argumentiert, dass — neben der Qualität der Gestaltung von Feed- 
back — die individuelle Wahrnehmung des Feedbacks durch die Schülerinnen und 
Schüler beeinflusst, ob sich das Feedback positiv auf den individuellen Lernprozess 
auswirkt (Willems & Dreiling, 2022). Beispielsweise konnte Hoya (2019) zeigen, 
dass das durch Grundschülerinnen und -schüler wahrgenommene Feedback der 
Lehrkraft zur Erklärung des Leseverständnisses beitragen kann. Allerdings wirkt 
sich Feedback nicht auf alle Schülerinnen und Schüler gleichermaßen positiv aus, 
da diese das Feedback aufgrund ihres Geschlechts und ihrer Leistung (Hoya, 2021; 
Sortker, 2019) sowie ihren motivationalen Lernvoraussetzungen (Rakoczy et al., 
2013; Willems & Dreiling, 2022) unterschiedlich wahrnehmen und verarbeiten. Die 
meisten der genannten Befunde beziehen sich auf die Primar- oder Sekundarstufe I. 
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Untersuchungen in der gymnasialen Oberstufe stellen damit eine weiterhin beste- 
hende Forschungslücke dar (vgl. Dreiling et al., 2018; Willems & Dreiling, 2022). 
Ein zentrales Anliegen der vorliegenden Arbeit besteht daher in der Betrachtung 
interindividueller Unterschiede in der Wahrnehmung von Dimensionen der Feed- 
backqualität im Deutschunterricht der gymnasialen Oberstufe sowie in der Unter- 
suchung der prädiktiven Bedeutsamkeit der Feedbackwahrnehmung für die Ent- 
wicklung der intrinsischen Lernmotivation als relevantes Zielkriterium von Unter- 
richt. 

Ein weiterer Forschungsschwerpunkt dieser Studie leitet sich aus dem Desiderat 
ab, dass sich — mit wenigen Ausnahmen (u.a. Lazarides et al., 2019; Lazarides, Fauth 
et al., 2021) — bislang kaum längsschnittlich ausgerichtete Untersuchungen zu der 
Frage finden, inwiefern sich Wahrnehmungen von Unterrichtsqualitätsmerkmalen 
wie Feedback über die Schulzeit hinweg differenziell verändern können und in wel- 
chem Zusammenhang diese Veränderungen mit der Motivationsentwicklung von 
Schülerinnen und Schülern stehen. Insbesondere für den Bereich der Sekundarstufe 
II mangelt es an längsschnittlichen Untersuchungen dieses Zusammenhangsmus- 
ters. Mit Blick auf die heterogene Schülerschaft in den leistungsdifferenzierten Kur- 
sen der Sekundarstufe II (Baumert & Köller, 2000; Nagy et al., 2006; Dreiling & 
Willems, 2020) und die damit einhergehenden Herausforderungen hinsichtlich der 
Anpassungen des unterrichtlichen Handelns an die interindividuellen Schülerinnen- 
und Schülerbedürfnisse, scheint es, dass Veränderungen der (wahrgenommenen) 
Feedbackqualität und der Motivation auch noch in der gymnasialen Oberstufe mög- 
lich sind. 


1.2 Ziele der Arbeit 


Die vorliegende Forschungsarbeit stellt die Perspektive der Lernenden in den Mit- 
telpunkt der Untersuchung. In Ergänzung zu Videostudien, die die Gestaltung von 
Feedback im Unterricht aus einer eher „objektiven“ Sicht heraus beschreiben (Lotz, 
2016), erlauben Schülerbefragungen einen Einblick in das subjektive Erleben des 
von der Lehrkraft erteilten Feedbacks (Waldis et al., 2010). Das übergeordnete Ziel 
ist die systematische und differenzierte Analyse der wahrgenommenen Qualität von 
Feedback aus der Sicht von Schülerinnen und Schülern und die Untersuchung dif- 
ferenzieller Wahrnehmungen von Feedback zu Beginn und zur Mitte eines Schul- 
jahres in der Sekundarstufe II. Im Fokus der Untersuchung steht außerdem auch 
die längsschnittlich ausgerichtete Frage nach der Veränderung der wahrgenomme- 
nen Qualität von Feedback im Laufe eines Schulhalbjahres und der prädiktiven Be- 
deutsamkeit der Feedbackwahrnehmung für die Entwicklung der intrinsischen 
Lernmotivation. Die zentralen Fragestellungen lauten: 
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(1) Wie nehmen Schülerinnen und Schüler das Feedback der Lehrkraft im 
Deutschunterricht der gymnasialen Oberstufe zu Beginn und zur Mitte ei- 
nes Schulhalbjahres wahr? 

(2) In welchem Zusammenhang steht die wahrgenommene Feedbackqualität 
mit der intrinsischen Lernmotivation? 

(3) Wird der Zusammenhang zwischen der wahrgenommenen Feedbackquali- 
tät und der Veränderung der intrinsischen Lernmotivation durch die wahr- 
genommene Nützlichkeit von Feedback und das Kompetenzerleben medi- 
iert? 


Die vorliegende Arbeit ist in das längsschnittlich angelegte Projekt „Feedback im 
Kontext von Heterogenität“ (Willems et al., 2020) eingebettet, in der in 49 Deutsch- 
kursen der gymnasialen Oberstufe 807 Schülerinnen und Schüler zu zwei Messzeit- 
punkten (Beginn und Mitte eines Schuljahres) standardisiert zu ihrer selbstbestimm- 
ten Lernmotivation sowie zu ihrer Wahrnehmung verschiedener Dimensionen der 
Feedbackqualität im Deutschunterricht befragt wurden. Aus methodischer Sicht 
wird zur Beantwortung der Fragestellungen mit dem Verfahren des Latent-True- 
Change-Modeling (Steyer et al., 2000) ein Strukturgleichungsansatz der Veränderungs- 
messung gewählt, bei dem es möglich ist, sowohl intraindividnelle Veränderungen der 
Feedbackwahrnehmung und der intrinsischen Motivation (Veränderung der Kon- 
strukte bei einer Person über die Zeit) als auch interindividuelle Unterschiede (Unter- 
schiede zwischen den Schülerinnen und Schülern) in den Ausgangswerten sowie 
Veränderungen zu betrachten und diese wechselseitig aufeinander zu beziehen 
(Dietrich, 2019; Geiser, 2011; Reuter et al., 2010). 


1.3 Aufbau der Arbeit 


Theoretischer Teil 


Der theoretische Teil der Arbeit umfasst zwei übergreifende Kapitel: In Kapitel 2 
werden ausgehend von unterschiedlichen Definitionen von Feedback zentrale the- 
oretische Modelle und empirische Befunde zur Qualität und Wirksamkeit von Feed- 
back im schulischen Unterricht vorgestellt. Hierbei wird insbesondere auf Modelle 
der Feedbackforschung sowie der pädagogisch-psychologisch orientierten Unter- 
richtsforschung eingegangen, die Prozesse der Wahrnehmung und Nutzung von 
Feedback durch die Schülerinnen und Schüler als wichtige Prädiktoren der Wirk- 
samkeit von Feedback herausstellen. Ausgehend von empirischen Befunden wer- 
den sodann geschlechtsspezifische Unterschiede sowie der Einfluss der Leistung 
auf die Feedbackwahrnehmung thematisiert. Die Beschreibung theoretischer An- 
sätze und aktueller Befunde zu Veränderungen von Unterrichts- und Feedback- 
wahrnehmungen bildet den Abschluss von Kapitel 2. 
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Vor dem Hintergrund des übergreifenden Ziels der Arbeit, die Wirkungen des 
wahrgenommenen Feedbacks auf die Veränderung der intrinsischen Lernmotiva- 
tion zu untersuchen, steht in Kapitel 3 die Aufarbeitung des theoretischen und em- 
pirischen Hintergrunds zur Lernmotivation und deren Zusammenhang zu Feed- 
back im Unterricht im Vordergrund. Nach einer Darstellung von motivationstheo- 
retischen Grundlagen sowie aktuellen empirischen Befunden zur Motivationsent- 
wicklung werden theoretische Ansätze und Forschungsbefunde zum Zusammen- 
hang zwischen Feedback und der intrinsischen Lernmotivation näher vorgestellt. In 
Kapitel 4 wird ein Rahmenmodell zur Analyse der Wahrnehmung und Wirkung von 
Feedback im schulischen Unterricht hergeleitet, welches auf einer Zusammenfüh- 
rung von theoretischen Ansätzen der Feedback- und Unterrichtsforschung beruht. 


Empirischer Teil 


Die im theoretischen Teil erarbeiteten Ausführungen und empirischen Erkennt- 
nisse bilden die Grundlage für die Untersuchung der Feedbackwahrnehmung der 
in der FeeHe-Studie befragten Schülerinnen und Schüler im Deutschunterricht der 
gymnasialen Oberstufe. Hierfür werden in Kapitel 5 die Fragestellungen und Hypo- 
thesen zu den drei Hauptforschungsfragen der Untersuchung vorgestellt. Im Kapi- 
tel zum methodischen Vorgehen wird zunächst die FeeHe-Studie beschrieben, be- 
vor auf die verwendeten Skalen zur Erfassung der Feedbackqualität im Unterrichts- 
gespräch und der motivationalen Konstrukte eingegangen wird (Kapitel 6). Das Ka- 
pitel beschäftigt sich abschließend mit der Darstellung der zentralen statistischen 
Analysen, die dieser Arbeit zugrunde liegen. 

Die Darstellung der Ergebnisse gliedert sich entlang der aufgestellten Fragestel- 
lungen (Kapitel 7). Im Anschluss an die Analysen zur Dimensionalität und Messin- 
varianz der wahrgenommenen Feedbackqualitat werden die Ergebnisse zur diffe- 
renziellen Wahrnehmung und Veränderung von Feedback im Verlauf eines Schul- 
halbjahres beschrieben (Hanprforschungsfrage D. Daran anschließend erfolgt die Dar- 
stellung der Befunde zu den Zusammenhangs- und Mediationsanalysen der wahr- 
genommenen Feedbackqualität mit der intrinsischen Lernmotivation der Lernen- 
den (Hauptforschungsfragen II und II). 

In der Diskussion (Kapitel! 8) werden die zentralen Ergebnisse der Arbeit zusam- 
mengefasst und vor dem theoretischen und empirischen Hintergrund diskutiert. 
Gemäß der Reihenfolge der aufgestellten Fragestellungen wird in Abschnitt 8.1.1 
zunächst die Dimensionalität von Feedback — als ein relevantes Qualitätsmerkmal 
von Unterricht — aus der Sicht von Schülerinnen und Schülern beschrieben. Es wird 
diskutiert, inwieweit sich die Hypothesen zum Einfluss des Geschlechts und der 
Leistung auf differenzielle Wahrnehmungen und Veränderungen von Feedback im 
Laufe eines Schulhalbjahres bestätigen lassen (Hauprforschungsfrage I). Der Abschnitt 
8.1.2 fokussiert auf die Kernfrage der vorliegenden Arbeit nach dem Zusammen- 
hang zwischen der Feedbackwahrnehmung und der intrinsischen Lernmotivation 
sowie der Veränderung der beiden Konstrukte über die Zeit (Hauprforschungsfrage II). 
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Hierbei soll insbesondere die theoretische Annahme von Angebots-Nutzungs-Mo- 
dellen diskutiert werden, die von einer reziproken Beziehung zwischen dem Ange- 
bot und Merkmalen der Lernenden ausgehen. Im Abschnitt 8.1.3 werden schließ- 
lich die Ergebnisse der Mediationsanalysen berichtet und in den bestehenden em- 
pirischen Forschungsstand eingebettet (Hanpfforschungsfrage III). Das Kapitel 8.1 
schließt mit einer Übersicht über Hypothesen und empirische Befunde der eigenen 
Studie ab (vgl. Tabelle 50). Es folgt eine Diskussion der Grenzen der Arbeit (Kapitel 
8.2) und daran anknüpfend ein Ausblick auf weiterführende Forschungsfragen für 
die Feedback- und Unterrichtsforschung (Kapitel 8.3). Abschließend werden mög- 
liche Implikationen im Hinblick auf eine förderliche und adaptive Gestaltung von 
Feedback im Deutschunterricht der Sekundarstufe II und die damit einhergehenden 
Anforderungen an die Professionalisierung von Lehrkräften im Rahmen der Aus- 
und Weiterbildung aufgezeigt (Kapitel 8.4). 


2 Feedback als Unterrichtsmerkmal 


Im folgenden Kapitel werden die für diese Forschungsarbeit relevanten theoreti- 
schen und empirischen Grundlagen zu Feedback im schulischen Unterricht darge- 
legt. Hierfür werden zunächst in Abschnitt 2.1 verschiedene Definitionsansätze von 
Feedback kurz beleuchtet. Eine zentrale Bedingung der Wirksamkeit von Feedback 
ist, wie das Feedback gestaltet ist; daher werden in Abschnitt 2.2 unterschiedliche 
Dimensionen der inhaltlichen Gestaltung von Feedback aufgeführt. Hierbei erfolgt 
auch eine Definition und theoretische Abgrenzung der in dieser Arbeit erfassten 
Feedbackdimensionen (Ergebnis, Prozess, Selbstregulation und Dialog). Daran an- 
schließend werden zentrale empirische Befunde zur Wirksamkeit von Feedback auf 
leistungs- und motivationsbezogene Zielkriterien von Unterricht (Abschnitt 2.3) 
und zur Ausprägung von Feedback im Unterricht aus einer „objektiven“ Beobach- 
terperspektive (Abschnitt 2.4) und zusammenfassend vorgestellt. Anhand von un- 
terschiedlichen theoretischen Modellen, wie dem Interaktionalen Rahmenmodell 
zur Gestaltung und Verarbeitung von Feedback nach Strijbos und Müller (2014) 
sowie den allgemeinen Angebots-Nutzungs-Modellen unterrichtlicher Wirkungen 
(Helmke, 2015; Vieluf et al., 2020), wird sodann aufgezeigt, dass neben der Gestal- 
tung von Feedback auch die Wahrnehmung dieses Feedbacks durch die Schülerin- 
nen und Schüler ein wichtiger Prädiktor im Prozess der Wirksamkeit von Feedback 
sein kann (Abschnitt 2.5). Hierzu werden zunächst zentrale theoretische Modelle 
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aus der Feedback- und Unterrichtsforschung skizziert (Abschnitt 2.5.1) und an- 
schließend werden die Herausforderungen bei der Erfassung der Wahrnehmung 
von Feedback thematisiert (Abschnitt 2.5.2). Dabei steht die methodische Frage- 
stellung im Vordergrund, wie die Schülersicht auf Feedback im Unterricht operati- 
onalisiert wird. Abschnitt 2.5.3 widmet sich der Beschreibung und Diskussion ak- 
tueller empirischer Befunde zu Prädiktoren von differenziellen Feedbackwahrneh- 
mungen. Ein Anliegen der vorliegenden Arbeit ist die längsschnittliche Untersu- 
chung der Feedbackwahrnehmung im Laufe eines Schulhalbjahres. Theoretische 
Perspektiven auf und empirische Belege zu Veränderungen von Unterrichts- und 
Feedbackwahrnehmung sind daher Gegenstand des Abschnitts 2.5.4. 


2.1 Definition von Feedback 


In der vorliegenden Arbeit liegt der Fokus auf dem Feedback durch die Lehrkraft 
im Sinne der Bereitstellung eines Unterrichts- bzw. Lernangebots. Auf den Kontext 
des Schulunterrichts bezogen kann Feedback „alle verbalen und nonverbalen Reak- 
tionen der Lehrkraft auf Schüleräußerungen oder Schülerverhalten“ (Lotz, 2016, S. 
196) umfassen. Dies ist allerdings eine weite Definition von Feedback und würde 
auch Formen von Feedback einschließen, die nicht im Zusammenhang mit der Leis- 
tung von Schülerinnen und Schülern stehen (z.B. Lob und Tadel). Daher wird für 
die vorliegende Arbeit eine engere Definition von Feedback gewählt: „Feedback 
wird als jede Art von Rückmeldung verstanden, die sich auf die Leistung oder das 
Verständnis des Lernenden bezieht, diesen über die Richtigkeit seiner Antwort bzw. 
seiner Aufgabenlösung informiert [...] oder ihm inhaltliche und/oder strategische 
Hilfen und Informationen zu seinem Bearbeitungsprozess zur Verfügung stellt 
[...] (Lipowsky, 2020, S. 83). Nach Hattie und Timperley (2007) kann Feedback 
von einer Lehrkraft, einem Mitschüler bzw. einer Mitschülerin oder vom Lernenden 
selbst erteilt werden. Davon abgrenzend wird das Erteilen von Lob und Tadel auch 
in dieser Arbeit nicht als Feedback klassifiziert, da Lob und Tadel häufig cher Be- 
kräftigungen oder Sanktionierungen infolge eines Schülerverhaltens enthalten und 
sich in der Regel nicht auf die erbrachte Leistung von Lernenden beziehen (Hattie, 
2009; Hattie & Timperley, 2007; Jacobs, 2002; Lipowsky, 2020; Lotz & Lipowsky, 
2015). 

In der Forschungsliteratur wird Feedback als ein Merkmal eines guten Unter- 
richts beschrieben (Brophy & Good, 1986; Hattie, 2009; Helmke, 2015; Lipowsky, 
2020; Pianta et al., 2008), da es die Lernprozesse der Schülerinnen und Schüler un- 
terstützt. Aus kognitionspsychologischer Sicht hat Feedback eine informierende 
Funktion, die darin besteht, die Diskrepanz zwischen der aktuellen Leistung und 
dem angestrebten Lernziel aufzuzeigen und zu verringern (Hattie & Timperley, 
2007; Krause et al., 2004; Ramaprasad, 1983). Einerseits kann es dabei die Richtig- 
keit einer Antwort oder Aufgabenbearbeitung bestätigen und so bestehende Wis- 
sensstrukturen oder Lösungswege festigen; andererseits kann es den Lernenden bei 
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einer falschen Antwort bzw. Aufgabenbearbeitung korrigieren und somit bereits 
bestehendes Wissen verändern (Kulhavy & Stock, 1989; Lotz, 2016; Huth, 2004; 
Mory, 2004). Auf diese Weise kann Feedback kognitive Prozesse bei Schülerinnen 
und Schülern aktivieren, also zu einer vertieften Auseinandersetzung mit dem Lern- 
gegenstand führen (Lotz, 2016). Neben der Relevanz für kognitive Lernprozesse ist 
auch die Bedeutsamkeit von Feedback für die Unterstützung motivationaler (Voll- 
meyer & Rheinberg, 2005) und selbstregulativer (Butler & Winne, 1995) Prozesse 
der Lernenden unumstritten (zfsd. Huth, 2004; Narciss, 2006). 

In der Forschung zur Unterrichtskommunikation wird Feedback außerdem als 
ein Element eines qualitätsvollen Unterrichtsgesprächs beschrieben (Denn, 2021; 
Pauli, 2006, 2010; Pehmer et al., 2015; Seidel et al., 2003). Der Stellenwert von Feed- 
back im Unterrichtsgespräch zeigt sich am Beispiel der IRE-Sequenz (Initiation- 
Reply-Evaluation-Sequenz; vgl. Lüders, 2003; Mehan, 1981; Mercer & Dawes, 2014; 
Richert, 2005), die als charakteristisches Muster der Interaktion zwischen Lehrkräf- 
ten und Lernenden im Unterricht gilt (Howe & Abedin, 2013; Lüders, 2003; Richert, 
2005). Demnach besteht das Unterrichtsgespräch aus einer Abfolge aus (1) Frage 
oder Impuls der Lehrkraft (Initiation), (2) Antwort der Schülerinnen und Schüler 
(Response) und (3) Feedback der Lehrkraft auf die Schülerantwort (Evaluation). Mit 
der Qualität von Feedback in diesem Dreischritt der Abfolge im Unterrichtsge- 
spräch haben sich viele Studien beschäftigt (u.a. Richert, 2005). Damit die Lernen- 
den im Unterrichtsgespräch nicht nur als „Stichwortgeber“ (Kobarg & Seidel, 2003, 
S. 174) fungieren, muss das Feedback so gestaltet sein, dass es die Schülerinnen und 
Schüler zu einer aktiven und vertieften Auseinandersetzung mit dem Lerngegen- 
stand anregt und ihr selbstbestimmtes Lernen unterstützt (Lotz & Lipowsky, 2016; 
Pauli, 2010). Daran anknüpfend wird im folgenden Abschnitt auf Dimensionen ei- 
ner qualitätsvollen Gestaltung von Feedback eingegangen. 


2.2 Dimensionen von Feedback 


Die Qualität der Gestaltung von Feedback im Unterricht nimmt einen wesentlichen 
Einfluss auf die Wahrnehmung und Verarbeitung durch die Lernenden (Kopp & 
Mandl, 2014a; Narciss, 2014) und auf eine förderliche Entwicklung motivational- 
affektiver sowie kognitiver Lernergebnisse der Schülerinnen und Schüler (Hattie & 
Timperley, 2007). In diesem Zusammenhang sind zahlreiche theoretische Modelle 
entstanden, die unterschiedliche Dimensionen der Feedbackqualität zusammenfas- 
send darstellen (u.a. Hattie & Timperley 2007; Kulhavy & Stock, 1989; Narciss, 
2006; Shute, 2008). In der Feedbackforschung hat sich die Unterscheidung einer 
einfachen und elaborierten Komponente von Feedback etabliert (u.a. Jacobs, 2002; 
Kulhavy & Stock, 1989; Narciss, 2006). Eine ausführliche Klassifizierung einfacher 
und elaborierter Feedbackformen findet sich bei Narciss (2006) (vgl. Tabelle 1). 


22 


Feedback als Unterrichtsmerkmal 


Tabelle 1: Klassifikation unterschiedlicher Feedbackkomponenten (Narciss, 2006, 


S. 23) 
Bezeichnung Beispiele für Feedbackinhalte 
ee | en oe 
E : Knowledge of result/response e = Falsch/ richtig 
a = (KR) e = Nicht richtig/ stimmt 
2 e _ Angabe der korrekten Lösung 


Knowledge of correct result (KCR) 


Markierung der korrekten Antwort 


Knowledge on task constraints 
KTO) 


Hinweise auf Art der Aufgabe 
Hinweise auf Bearbeitungsregeln 
Hinweise auf Teilaufgaben 


Hinweise auf Aufgabenanforderungen 


Knowledge about concepts (KC) 


Hinweise auf Fachbegriffe 


Beispiele für Begriffe 


Hinweise auf Begriffskontext 


Erklärungen zu Begriffen 


Knowledge about mistakes (KM) 


Elaborierte 
Komponenten 


Anzahl der Fehler 

Ort der Fehler/des Fehlers 
Art der Fehler/des Fehlers 
Ursache/n des/r Fehler(s) 


Knowledge on how to proceed 
(KH) 


Fehlerspezifische Korrekturhinweise 
Aufgabenspezifische Lösungshinweise 
Hinweise auf Lösungsstrategien 
Leitfragen 

Lösungsbeispiele 


Knowledge on meta-cognition 
(KMC) 


Hinweise auf meta-kognitive Strategien 


Meta-kognitive Leitfragen 


Das Feedback bezieht sich dabei in der Regel auf Aufgaben mit einer eindeutigen 
Lösung bzw. Antwort, weshalb die Klassifizierung häufig im Rahmen von compu- 
terbasierten Lernumgebungen Anwendung findet. Als einfache Komponente wer- 
den solche Feedbackarten gewertet, die den Lernenden im Anschluss an eine Ant- 
wort oder eine Aufgabenbearbeitung darüber informieren, wie der aktuelle Leis- 
tungsstand ist (knowledge of performance), ob eine Antwort richtig oder falsch ist (know- 
ledge of result) oder wie die richtige Lösung ist (knowledge of correct result) (Narciss, 2006). 
Eine weitere Form einfachen Feedbacks ist answer until correct (u.a. Jacobs, 2002; Kul- 
havy & Stock, 1989; Richert, 2005). Hierbei fordert die Lehrkraft den Schüler oder 
die Schülerin nach einer falschen Antwort zu weiteren Antwortversuchen auf, bis 
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die richtige Lösung genannt wird (Lotz, 2016; Richert, 2005). Während diese einfa- 
chen Feedbackarten dem Lernenden nur wenige Informationen bereitstellen und 
nicht über die Mitteilung der richtigen Antwort hinausgehen, enthält elaboriertes 
Feedback ergänzende Hinweise, die zur Verbesserung der Aufgabenbearbeitung 
beitragen können. Hierzu zählen nach Narciss (2006) u.a. Hinweise zur Aufgaben- 
stellung (knowledge on task constraints), zur Korrektur oder Lösung einer Aufgabe 
(knowledge on how to proceed), zu Fehlern bei der Aufgabenbearbeitung (knowledge about 
mistakes) oder zu metakognitiven Strategien (knowledge on meta-cognition). 

Auf Basis von Ergebnissen aus Metaanalysen entwickeln Hattie und Timperley 
(2007) in ihrem Review ein konzeptuelles Modell von Feedback im unterrichtlichen 
Kontext. Im Wesentlichen werden in dem Modell zwei Bereiche der Gestaltung von 
effektivem Feedback beschrieben (vgl. Abbildung 1): Der erste Bereich beinhaltet 
drei unterschiedliche Fragen von effektivem Feedback. Demnach beantwortet 
Feedback die Frage nach dem Lernziel einer Aufgabenstellung (Feed Up), nach dem 
aktuellen Leistungsstand und möglichen Diskrepanzen zu dem Lernziel (Feed Back) 
und nach Hilfestellungen sowie Strategien zum Erreichen des Lernziels (Feed For- 
ward). Im zweiten Bereich des Modells werden inhaltlich vier unterschiedliche Ebe- 
nen von Feedback unterschieden (i) Aufgabe (tas£-/eve), (it) Prozess (process-level), (ii) 
Selbstregulation (self-regulation level) und (tv) Person (se/f-leve)). 


Effektives Feedback beantwortet drei Fragen 


« Was ist das Ziel? Feed Up 

« Wie geht es voran? Feed Back 

« Was sind die nächsten Schritte? Feed Forward 
y 


Vier Ebenen von Feedback 


Aufgabe Prozess Selbstregulation Selbst 
A s Wie kann eine Aufgabe Hilfestellungen zur eii 
Wie gut wurde die Aufgabe 7 ard y oes Persönliche Bewertung des 
verstanden/erledigt? erfolgreich bewältigt eigenständigen Steuerung Lemenderi 
werden? der Lernaktivitäten 


Abbildung 1: Ebenen des Feedbacks (nach Hattie und Timperley, 2007; vereinfachte Darstellung) 


(i) Feedback auf der Aufgabenebene enthalt Informationen, wie gut eine Auf- 
gabe bearbeitet wurde und inwieweit die angestrebten Lernziele erreichten 
wurden. Diese Feedbackebene, vor allem die aufgabenbezogene Ergebnis- 
rückmeldung, findet nach Hattie und Timperley die häufigste Verwendung 
im Unterricht. 


24 Feedback als Unterrichtsmerkmal 


(it) Ein Feedback auf der Prozessebene fokussiert auf das Wie des Lernens, 
also die Art und Weise, wie der Lernprozess gestaltet wird und wie die 
Lernziele erreicht werden können. Hierbei erhält der Lernende konkrete 
Hinweise, ob die einzelnen Schritte und angewandten Strategien angemes- 
sen sind oder ein alternativer Lernweg eingeschlagen werden muss, um das 
Lernziel zu erreichen. Während Feedback auf der Aufgabenebene kein Tie- 
fenverständnis befördern kann, liefert Feedback auf der Prozessebene den 
nötigen Anstoß, Informationen zu verarbeiten und Lernstrategien effekti- 
ver anzuwenden, um zur Lösung der Aufgabe zu gelangen (vgl. Berger et 
al., 2013). 

(tit) Feedback auf der Ebene der Selbstregulation informiert Lernende darüber, 
wie gut sie ihre Lernaktivitäten eigenständig überwachen, steuern und re- 
gulieren können, um das jeweilige Lernziel zu erreichen. Die Herausforde- 
rung bei dieser Feedbackebene besteht darin, dass Lernende Fähigkeiten 
der Selbsteinschätzung mitbringen, mit denen sie eigenständig Diskrepan- 
zen in ihrer Aufgabenbearbeitung erkennen und Strategien entwickeln, um 
die Diskrepanzen zu beheben und ihrem Lernziel näherzukommen (Hattie 
& Timperley, 2007). 

(iv) Das Feedback auf der Ebene der Person gilt als am wenigsten förderlich, 
sofern es nur Lob an den Lernenden enthält und keine Informationen in 
Bezug auf die Leistung oder den Lernprozess bereithält (Hattie & Timper- 
ley, 2007; Hattie & Clarke, 2019). Die Autoren unterscheiden in dieser Hin- 
sicht zwischen einem lernunwirksamen Lob bezogen auf das Selbst (z.B. 
„Gut gemacht!“) und einem Lob, das mit der Bewältigung der Aufgabe 
verbunden ist (z.B. Lob zur Anstrengungsbereitschaft oder zum Engage- 
ment). 


Anknüpfend an die Forschungsarbeit von Hattie und Timperley (2007) wurde im 
Rahmen des Projekts FeeHe (Willems & Dreiling, 2022; Willems et al., 2020; vel. 
auch Dreiling et al., 2018) ein Modell der Feedbackqualitat entwickelt, das die vier 
Dimensionen Ergebnisorientierung, Prozessorientierung, Selbstregulationsorientierung und Di- 
alogorientierung umfasst (vgl. Abbildung 2). In den Untersuchungen von Willems und 
Dreiling (2022) steht die Wahrnehmung der Dimensionen der Feedbackqualitat aus 
der Perspektive der Schülerinnen und Schüler im Kontext des Unterrichtsgesprächs 
im Mittelpunkt. Daher orientieren sich die Autorinnen bei der Operationalisierung 
der Dimensionen von Feedback nicht nur an dem Feedback-Modell nach (Hattie 
& Timperley, 2007), sondern auch an theoretischen Konzepten einer qualitätsvollen 
und produktiven Gestaltung von Unterrichtsgesprächen mit der gesamten Klasse 
(Lipowsky & Lotz, 2015; Pauli & Reusser, 2018; Pehmer et al., 2015). 
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Feedbackqualität 


Informationen zu (Strategische) Impulse zur Impulse zur 
Lernzielen Hinweise zur eigenständigen Bewertung 
und zum Verbesserung des Kontrolle des durch die 
Leistungsstand Lernprozesses Lernprozesses 


gering 


Abbildung 2: Dimensionen der Feedbackqualitat (eigene Darstellung). 


Die ergebnisorientierte Dimension von Feedback beinhaltet einfache Informationen 
über die Richtigkeit einer Antwort und darüber, ob die Antwort den Erwartungen 
der Lehrkraft entspricht oder was die angestrebten Ziele der Aufgabenstellung sind. 
Im Vordergrund steht dabei die Annahme, dass Feedback effektiver ist, wenn es 
sich auf konkrete Lernziele bezieht (Hattie & Timperley, 2007; zfsd. Hoya, 2019). 
Während die ergebnisorientierte Dimension dem Lernenden eher einfache Infor- 
mationen bereitstellt, enthält die prozessorientierte Dimension ergänzende, meist stra- 
tegische Hinweise (z.B. zur Aufgabenstellung, zum konzeptuellen Verständnis), da- 
mit Lernende ihre Antwort verbessern können. Die prozessorientierte Dimension 
zählt zu den elaborierten Dimensionen von Feedback, da sie weiterführende Infor- 
mationen enthält. Neben der aufgaben- und prozessorientierten Feedbackdimen- 
sion werden in dem Modell von Dreiling et al. (2018) und Willems und Dreiling 
(2022) noch zwei weitere elaborierte Dimensionen unterschieden: eine se/bstregulati- 
onsorientierte und dialogorientierte Dimension. Bei der selbstregulationsorientierten Di- 
mension von Feedback gibt die Lehrkraft durch gezielte Ruckragen und Denkimp- 
ulse dem einzelnen Lernenden die Möglichkeit zur eigenständigen Bewertung und 
Verbesserung der Antwort, sodass die Fähigkeiten zur Regulation des Lernprozes- 
ses angeregt werden. Die selbstregulationsorientierte Dimension ist daher ein Feed- 
back auf der metakognitiven Ebene. Die dialogorientierte Dimension von Feedback 
umfasst, dass die Beiträge der Schülerinnen und Schüler nicht mehr bloß von der 
Lehrkraft evaluiert, sondern zum Nachdenken und kritischen Bewerten an die ge- 
samte Klasse weitergegeben werden. 
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Mit der Einführung einer dialogorientierten Feedbackdimension knüpfen Drei- 
ling et al. (2018) und Willems und Dreiling (2022) — so argumentieren sie — ur- 
sprünglich an die Überlegungen von Pauli (2006, 2010; vgl. auch Pauli & Reusser, 
2018) zum produktiven Unterrichtsgespräch an, welches eine Abweichung vom 
stark lehrkraftgeleiteten Unterrichtsgespräch darstellt und stattdessen die aktive Be- 
teiligung der Lernenden am Unterrichtsgespräch anregt. Hiernach besteht die Funk- 
tion von Feedback auch darin, dass Prozesse des ko-konstruktiven Ideen- und Wis- 
sensaufbaus (Lipowsky, 2020; Pauli, 2010; Pauli & Reusser, 2018) ausgelöst werden, 
bei denen die Lernenden durch den gegenseitigen Austausch neue Ideen, Argu- 
mente und Lösungen entwickeln (Lipowsky, 2020; Orsmond et al., 2013). 

Ergänzend kann an dieser Stelle argumentiert werden, dass auf der Ebene der 
aufgaben- und prozessorientierten Dimension der Feedbackgestaltung noch eine 
stärkere Steuerung und Anleitung des Lernprozesses durch die Lehrkraft stattfinden 
(vgl. Abbildung 2). Indem konkrete Informationen zum Leistungsstand und zur 
Verbesserung des Lernprozesses erteilt werden, werden dem Lernenden vergleichs- 
weise wenig Möglichkeiten zur aktiven Beteiligung an der Evaluation des Beitrags 
gegeben. Demgegenüber sind die selbstregulations- und dialogorientierte Dimen- 
sion dadurch gekennzeichnet, dass das Feedback der Lehrkraft weniger Anleitungen 
zur Verbesserung des Lernprozesses enthält. Stattdessen gibt die Lehrkraft die Ver- 
antwortung für die Bewertung und Verbesserung des Beitrags an den Beitragenden 
selbst (selbstregulationsorientierte Dimension) oder die gesamte Klasse (dialogorien- 
tierte Dimension) weiter. So gesehen haben beide Dimensionen einen stärkeren Di- 
alogcharakter und fördern damit die Selbstevaluation sowie -regulation — nur liegt 
der Fokus bei der Feedbackgestaltung entweder auf dem Feedbackdialog zwischen 
der Lehrkraft mit dem einzelnen Schüler bzw. der einzelnen Schülerin oder auf dem 
Feedbackdialog zwischen der Lehrkraft mit der Klasse und zwischen den peers un- 
tereinander (Orsmond et al., 2013). Theoretisch gestützt wird diese Argumentation 
durch die neuere Feedbackforschung, die fordert, dass Feedback als Dialog gestaltet 
werden sollte (Nicol, 2010; Nicol & Macfarlane-Dick, 2006; Orsmond et al., 2013). 

Vor diesem Hintergrund ist auch die Kategorisierung von Feedback bei Sortkaer 
(2018) entstanden. Der Autor unterscheidet zwischen zwei Dimensionen, die im 
Grad der Anleitung und Steuerung durch die Lehrkraft variieren: Das directive feed- 
back und das facilitative feedback. Das directive feedback kann sowohl einfache als auch 
elaborierte Informationen enthalten, die den Lernenden dazu anleiten, wie die Leis- 
tung oder der Lernprozess verbessert werden kann. Hier findet kein Dialog zwi- 
schen der Lehrkraft und dem Lernenden statt, sodass auch die selbstregulativen 
Prozesse eingeschränkt werden (Sortkaer, 2018). Dieses Feedback ist außerdem 
spezifischer und detaillierter als das facilitative feedback, das durch elaborierte Hin- 
weise den Lernenden zur eigenständigen Regulation des Lernprozesses anregt. Der 
Autor argumentiert, dass beim facilitative feedback mehr Raum für den Feedbackdia- 
log zwischen der Lehrkraft und dem Schüler bzw. der Schülerin geschaffen wird, 
was als förderlicher für die Selbstregulation und folglich den Lernerfolg angesehen 
wird (Sortkaer, 2018 in Anlehnung an Nicol, 2010 und Orsmond et al., 2013). 
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2.3 Empirische Befunde zu Wirkungen von Feedback 


Im vorangegangenen Kapitel wurde aufgezeigt, welche Dimensionen ein lernför- 
derliches Feedback auszeichnen. Gegenstand des folgenden Kapitels ist die Frage, 
wie das Feedback — als Angebot — mit der Leistung sowie Motivation von Lernen- 
den - als Zielkriterien des Unterrichts — zusammenhängt. Aus methodischer Sicht 
soll dabei sowohl auf Studien eingegangen werden, in denen diese Zusammenhänge 
durch Videoanalysen geprüft wurden, als auch auf Studien, die die Wirksamkeit des 
Erteilens von Feedback im Rahmen von experimentellen Lernsettings untersucht 
haben. 

Im Allgemeinen ist die Bedeutsamkeit von Feedback für den Lernerfolg von 
Schülerinnen und Schülern anhand zahlreicher Metaanalysen dargelegt worden 
(Bangert-Drowns et al., 1991; Hattie, 2009; Hattie & Zierer, 2019; Kluger & DeNisi, 
1996; Kulhavy & Stock, 1989; Seidel & Shavelsson, 2007; Wisniewski et al., 2020). 
In ihrem Review berichten Hattie und Timperley (2007), dass Feedback mit einer 
durchschnittlichen Effektstärke von d= .79 einer der lernwirksamsten Faktoren im 
Unterricht darstellt. Demzufolge ist das Erteilen von Feedback bei einer Aufgaben- 
bearbeitung förderlicher für den Lernerfolg als eine Aufgabenbearbeitung, bei der 
Lernende kein Feedback für ihre Leistung erhalten (Bangert-Drowns et al., 1991; 
Labuhn et al., 2010; Wollenschläger et al., 2011). Einschränkend ist festzuhalten, 
dass sich über alle Studien hinweg große Streuungen der Effektstärken zeigen; zum 
Teil kann Feedback keine oder sogar negative Auswirkungen auf den Lernprozess 
haben. Auch die Überlegenheit elaborierter Feedbackdimensionen gegenüber ein- 
fachen Feedbackdimensionen konnte nicht eindeutig belegt werden (Bangert- 
Drowns et al., 1991; Kluger & DeNisi, 1996; Kulhavy & Stock 1989; Hattie, 2009). 
Neben einer hohen methodischen Variabilität der Studien (u.a. Fach, Lernkontext, 
Alter der Lernenden) liegt eine weitere Ursache für die uneinheitlichen Ergebnisse 
auch darin begründet, dass unterschiedliche Dimensionen von Feedback auch un- 
terschiedlich wirksam sind. Demzufolge ist die Effektivität von Feedback maßgeb- 
lich davon abhängig, wie qualitätsvoll die Information ist, die dem Lernenden be- 
reitgestellt wird (Hattie & Timperley, 2007; Wisniewksi et al., 2020). Insofern ergibt 
sich ein einheitlicheres Bild der Befundlage, wenn bei der Betrachtung und Inter- 
pretation der Effekte nach den Qualitätsdimensionen von Feedback differenziert 
wird (Lipowsky, 2020; Wisniewksi et al., 2020). 

Entsprechend wird argumentiert, dass einfaches, ergebnisorientiertes Feedback 
am wenigsten förderlich für den Lernprozess ist, während elaboriertes Feedback 
zum Prozess der Aufgabenbearbeitung (prozessorientierte Dimension) und zur 
Selbstregulation (selbstregulationsorientierte Dimension) vergleichsweise effektiver 
ist (Hattie & Timperley, 2007). Aus kognitionspsychologischer Sicht kann die Lern- 
wirksamkeit von solchen elaborierten Dimensionen von Feedback darin begründet 
liegen, dass sie zu einer intensiveren Auseinandersetzung mit dem Lerngegenstand 
und damit zu einem vertieften Verständnis der Lerninhalte beitragen (Lipowsky & 


28 Feedback als Unterrichtsmerkmal 


Lotz, 2015; Pauli & Reusser, 2018). Aus motivationspsychologischer Sicht kann da- 
von ausgegangen werden, dass sich elaboriertes, positiv unterstützendes Feedback 
— vermittelt über das Kompetenzerleben — positiv auf die selbstbestimmte Motiva- 
tion von Lernenden auswirken sollte (vgl. Deci & Ryan, 2000; Kiemer et al., 2015; 
Kobarg & Seidel, 2007; Pauli, 2010; Pauli & Reusser, 2018; Rakozcy et al., 2008; 
Ryan & Deci, 2000). 

Diese Annahmen zur Überlegenheit elaborierter Feedbackdimensionen werden 
auch durch verschiedene experimentell angelegte Studien empirisch untermauert, in 
denen Feedback — häufig unter Laborbedingungen — nach einer Antwort oder einer 
Aufgabenbearbeitung (computerbasiert) erteilt wird. So berichten Berner et al. 
(2022) in einer quasi-experimentellen Untersuchung, dass das Erteilen von elabo- 
riertem Feedback im Vergleich zu einfachem Feedback zu positiveren Effekten auf 
den Erwerb mathematischer Kompetenzen bei Lernenden im Vorschulalter führt. 
Huth (2004) und Narciss und Huth (2006) stellen in ihren experimentellen Unter- 
suchungen heraus, dass sich elaboriertes Feedback, das neben der Information zur 
Richtigkeit der Aufgabenbearbeitung auch weiterführende Hinweise zur Aufgaben- 
bearbeitung enthält, positiv auf die Leistung und die Motivation von Grundschul- 
kindern bei einem Rechentest auswirkt. Auch im Rahmen von experimentellen Stu- 
dien mit Studierenden konnten positive Effekte auf die Leistung durch ein elabo- 
riertes Feedback, welches neben Informationen zum Leistungsstand auch Erklärun- 
gen oder detaillierte Hinweise zur Verbesserung des Lernprozesses beinhaltet, her- 
ausgestellt werden (Krause et al., 2004; Lipnevich & Smith, 2009). 

Anhand der Analysen im Rahmen des Co?Ca-Projekts (Klieme et al., 2010) kön- 
nen die leistungs- und motivationsförderlichen Effekte elaborierten Feedbacks im 
schulischen Unterricht aufgezeigt werden (Harks et al., 2014; Rakoczy et al., 2013; 
Rakoczy et al., 2019). Schülerinnen und Schüler der neunten Klassenstufe erhielten 
im Mathematikunterricht entweder ein einfaches (notenorientiertes) oder ein elabo- 
riertes (prozessorientiertes) Feedback nach einem Test. Beim prozessorientierten 
Feedback wurden die Schülerinnen und Schüler schriftlich über den individuellen 
Lernstand im Vergleich zu den Lernzielen und über Strategien zum Erreichen des 
Lernziels informiert. Die Befunde verdeutlichen, dass sich prozessorientiertes Feed- 
back positiver auf die Änderung der Mathematikleistung und des Interesses aus- 
wirkt als einfaches Feedback in Form von Noten (Harks et al., 2014; Rakoczy ct al., 
2013). Dieser Effekt des prozessorientierten Feedbacks wurde zum Teil über die 
von den Lernenden wahrgenommene Nützlichkeit (Harks et al., 2014; Rakoczy et 
al., 2013; Rakoczy et al., 2019) und die wahrgenommene Kompetenzunterstützung 
(Rakoczy ct al., 2013) mediiert. 

Darüber hinaus liegen auch Befunde von Videostudien vor, die Zusammen- 
hänge zwischen Feedback im Unterrichtsgespräch und der Leistungs- sowie Moti- 
vationsentwicklung von Schülerinnen und Schülern beschreiben (Jurik et al., 2014; 
Kiemer et al., 2015; Rakoczy et al., 2008). So untersuchen Rakoczy et al. (2008) 
Feedback im Mathematikunterricht der Sekundarstufe I aus der Beobachterper- 
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spektive. Die Autoren berichten von positiven Wirkungen eines einfachen (positi- 
ven) Feedbacks zur Richtigkeit einer Antwort und eines elaborierten (prozessorien- 
tierten) Feedbacks, das Hinweise zum weiteren Vorgehen enthält, auf die von Schü- 
lerinnen und Schülern eingeschätzte intrinsische Lernmotivation im Fach Mathe- 
matik. Allerdings konnten weder für einfaches Feedback noch für elaboriertes Feed- 
back bedeutsame Zusammenhänge mit der Leistungsentwicklung festgestellt wer- 
den, was die Autoren darauf zurückführen, dass sie nicht zwischen unterschiedli- 
chen Dimensionen von elaboriertem Feedback differenziert haben. 

Kiemer et al. (2015) untersuchen im Rahmen einer längsschnittlichen Interven- 
tionsstudie über ein Schuljahr, inwiefern eine videobasierte Intervention zur Ent- 
wicklung von professionellen Kompetenzen im Bereich des produktiven Unter- 
richtsgesprächs (u.a. Feedback) zu einer positiven Entwicklung des Interesses und 
der selbstbestimmten Motivation der Schülerinnen und Schüler für das Lernen im 
mathematisch-naturwissenschaftlichen Unterricht führt. Dabei wurde auch das von 
Lehrkräften erteilte Feedback im Unterrichtsgespräch videobasiert analysiert, wäh- 
rend die motivationalen Merkmale über die Einschätzungen von Schülerinnen und 
Schülern erfasst wurden. Die Ergebnisse zeigen, dass Schülerinnen und Schüler der 
Interventionsgruppe, in der die Lehrkräfte mehr elaboriertes Feedback (prozess- 
und selbstregulationsorientiert) und weniger einfaches (ergebnisorientiertes) Feed- 
back im Unterrichtsgespräch erteilten, über eine höhere wahrgenommene Autono- 
mie- und Kompetenzunterstützung sowie eine höhere selbstbestimmte Motivation 
berichteten. Außerdem war das Feedback in der Interventionsgruppe prädiktiv für 
eine positive Entwicklung des fachspezifischen Interesses der Schülerinnen und 
Schüler. 

In der Videostudie von Jurik et al. (2014) im Physikunterricht des neunten Jahr- 
gangs wurden unterschiedliche Dimensionen von Feedback (Aufgabe, Prozess, 
Selbstregulation, Selbst), das von der Lehrkraft im Unterrichtsgespräch als Reaktion 
auf Schülerantworten erteilt wurde, durch externe Beobachterinnen und Beobach- 
ter kodiert und in Beziehung zu den kognitiven und motivationalen Merkmalen der 
Schülerinnen und Schüler gesetzt. Die Befunde verweisen darauf, dass das „objek- 
tiv“ erfasste Feedback die von Schülerinnen und Schülern eingeschätzte kognitive 
Lernaktivität und die intrinsische Lernmotivation positiv vorhersagt. Allerdings 
können keine Rückschlüsse gezogen werden, welche Dimension von Feedback am 
förderlichsten sind, da in den Analysen nicht mehr zwischen den unterschiedlichen 
Feedbackdimensionen differenziert wurde. 

Zusammenfassend konnte anhand der aufgeführten Befunde belegt werden, dass 
das Erteilen von elaboriertem Feedback sich bedeutsam auf die Motivation und 
Leistung von Lernenden auswirkt. Dabei wird deutlich, dass in den dargestellten 
Studien häufig das erteilte Feedback im Rahmen quasi-experimenteller Designs im 
Fokus steht, wobei lediglich zwischen einem einfachen und einem elaborierten 
Feedback differenziert wird. Unklar bleibt, inwiefern sich die Effekte zwischen den 
in der Theorie abgeleiteten elaborierten Dimensionen der Feedbackqualität (pro- 
zessorientiert, selbstregulationsorientiert) unterscheiden (vgl. Jurik et al., 2014). 
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2.4 Empirische Befunde zur Häufigkeit von Feedback im 
Unterricht 


Trotz der nachgewiesenen Bedeutung von Feedback für kognitive und motivatio- 
nale Lernprozesse verweisen Studien darauf, dass Feedback von Lehrkräften in der 
Unterrichtspraxis nur selten den Qualitätsanforderungen entspricht und das Vor- 
kommen von einfachem Feedback, welches nur wenige Informationen bereitstellt, 
im Unterricht dominiert (Denn et al., 2015; Kobarg & Seidel, 2007; Krammer et al., 
2010; Lotz, 2016; Pohlmann-Rother et al., 2020; Voermann et al., 2012). Um die 
Gestaltung von Feedback im Unterricht zu beschreiben und zu bewerten, greifen 
solche Untersuchungen methodisch häufig auf Videoanalysen zurück (Lotz, 2016). 
Anders als Studien, deren Datengrundlage Befragungen von Schülerinnen und 
Schülern sind, ermöglichen Untersuchungen unter Verwendung von Beobach- 
tungsdaten die Erfassung einer objektiveren Perspektive auf den Unterricht (Lotz, 
2016; Pianta & Hamre, 2009; Seidel & Thiel, 2017) und bieten vor allem „punktuelle 
Einsichten“ (Waldis et al., 2010, S. 173) in die unterrichtliche Feedbackpraxis. Auf 
einzelne Forschungsbefunde zur videobasierten Erfassung der Ausprägung von 
Feedback im Schulunterricht soll im folgenden Abschnitt näher eingegangen wer- 
den. 

Seidel et al. (2003) untersuchen anhand von Videoanalysen im Physikunterricht 
die Ausprägung von Feedback durch die Lehrperson im Unterrichtsgespräch. Die 
deskriptiven Auswertungen der einbezogenen Physikklassen verweisen auf relativ 
geringe Anteile von „sachlich-konstruktiven“ und „positiven“ Rückmeldungen (mi- 
nimal 3.1% und maximal 22.2%) während des Unterrichtsgesprächs. Darüber hin- 
aus verweisen vertiefende Analysen auf negative Effekte einer hohen Engführung 
des Klassengesprächs auf selbstbestimmte Formen der Lernmotivation und auf das 
physikbezogene Interesse der Schülerinnen und Schüler. Die Engführung des Klas- 
sengesprächs zeichnet sich u.a. durch ein geringes Vorkommen sachlich-konstruk- 
tiver Rückmeldungen aus. 

Ähnlich verweisen auch die Auswertungen der IPN-Videostudie von Kobarg 
und Seidel (2007), dass einfaches Feedback in Form von Bestätigungen oder Falsi- 
fizierungen der Antworten von Schülerinnen und Schüler den größten Teil aller 
Rückmeldungen im Physikunterricht darstellt (MW = 87.54%, SD = 7.89). Demge- 
genüber kommen sachlich-konstruktive Rückmeldungen (MW = 5.01%, SD = 
3.57), die Informationen zur Verbesserung der Lernprozesse und -strategien bein- 
halten, sowie positiv-unterstützende Rückmeldungen (MW = 7.35%, SD = 7.24), 
welche die Motivation zur aktiven Beteiligung im Unterricht unterstützen, nur sel- 
ten vor. Einschränkend ist festzuhalten, dass die Standardabweichungen auf Unter- 
schiede in der Häufigkeit der Arten von Feedback zwischen den untersuchten Klas- 
sen verweisen. 
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Lotz (2016) untersucht im Rahmen der PERLE-Videostudie das Feedback von 
Lehrkräften im Leseunterricht der Grundschule. Die Ergebnisse zeigen, dass Lehr- 
kräfte zwar insgesamt häufig Feedback erteilen (MW ro Minute = 4.75). Allerdings fällt 
in den detaillierten Kodierungen der einzelnen Reaktionen auf, dass einfaches Feed- 
back am häufigsten erteilt wird, während der durchschnittliche Anteil elaborierten 
Feedbacks, das über die Richtigkeit der Antwort hinausgehende Hinweise enthält, 
bei lediglich 18.03% liegt. Im Einzelnen zeigen die Analysen, dass Lehrkräfte am 
häufigsten Feedback zur Lösung (40.20%) erteilen. In 39.09% der Fäll kommt eine 
Kombination aus Feedback zur Lösung und zum Prozess der Aufgabenbearbeitung 
vor. Seltener wird in den untersuchten Lerngruppen ausschließlich prozessbezoge- 
nes Feedback beobachtet (12.32%). Lediglich 4.92% der Feedbacks der Lehrkräfte 
hatten keinen inhaltlichen Bezug zur Leseübung. 

Die Befunde von Denn ctal. (2015), die das Feedback von Lehrkräften im Ma- 
thematikunterricht der Grundschule untersuchen, weisen die Dominanz von einfa- 
chem Feedback zur Lösung nach (80.60%). Feedback zum Prozess der Aufgaben- 
bearbeitung wird hingegen in nur 6.18% der Fälle erteilt (gefolgt von Feedback zum 
Arbeits- und Sozialverhalten und Feedback zu persönlichen Merkmalen der Schü- 
lerinnen und Schüler). Bemerkenswert ist auch der Befund, dass im Mittel nur die 
Hälfte der Feedbacks an einen Schüler oder an eine Schülerin überhaupt als mathe- 
matikbezogen kategorisiert wurde (MW = 47.32%). 

Mittels Videodaten untersuchen Pohlmann-Rother et al. (2020), wie haufig und 
welche Form von Feedback Grundschullehrkräfte während einer Schülerarbeits- 
phase beim Schreiben erteilen. Die Ergebnisse demonstrieren deutliche Unter- 
schiede im Feedbackverhalten der Lehrkrafte: Die Mehrheit aller in der Stichprobe 
erfassten Rückmeldungen (66.88%) enthält keine elaborierten Informationen in 
Form von Begründungen, Erläuterungen und Hinweisen zur richtigen bzw. fal- 
schen Antwort. Demgegenüber werden einfache Formen von Feedback (knowledge 
of result oder knowledge of correct result) häufiger erteilt. 

Auch für den internationalen Schulkontext konnte die Studie von Voermann et 
al. (2012) belegen, dass Lehrkräfte nur selten Feedback zum individuellen Lernfort- 
schritt (progress feedback) oder Feedback zur Leistung in Bezug zu den angestrebten 
Lernzielen (discrepancy feedback) bereitstellen. Weitaus häufiger verwenden die Lehr- 
kräfte unspezifisches Feedback ohne Bezug zu den Leistungen oder zum Lernpro- 
zess der Schülerinnen und Schüler (z.B. Lob). 

Zusammenfassend zeigt sich in den videobasierten Untersuchungen zum einen die 
Dominanz von Feedback in Form von einfachen Evaluationen. Zum anderen 
konnten teilweise aber auch beträchtliche Unterschiede im Feedbackverhalten zwi- 
schen den einzelnen Klassen bzw. Lehrpersonen nachgewiesen werden, die darauf 
hindeuten, dass es auch durchaus Klassen gibt, in denen ein höherer Anteil elabo- 
rierter Feedbackdimensionen erteilt wird. In diesem Zusammenhang gehen einzelne 
Untersuchungen auch der Frage nach, ob es von bestimmten Merkmalen wie dem 
Geschlecht der Schülerinnen und Schüler abhängt, welche Dimension von Feed- 
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back Lehrkräfte erteilen. Die empirischen Befunde verweisen insbesondere auf ge- 
schlechtsspezifische Unterschiede im Erteilen von micht-kistungsbexogenem Feedback 
wie Lob und Tadel (Denn et al., 2015; Irvine, 1986). Die Befunde in Bezug auf die 
Zusammenhänge zwischen dem Erteilen von /eistungsbezogenem Feedback und dem 
Geschlecht der Schülerinnen und Schüler sind nicht konsistent. Während Denn et 
al. (2015) für den Leseunterricht der Grundschule keine geschlechtsspezifischen 
Unterschiede im inhaltlichen Bezug von Feedback feststellen konnten, weisen an- 
dere Studien nach, dass Jungen tendenziell mehr Feedback erhalten (Pohlmann- 
Rother et al., 2020). 


2.5 Die Rolle der Wahrnehmung von Feedback 


2.5.1 Theoretische Modelle zur Wahrnehmung von Feedback 


Die Befundlage zu Wirkungen von Feedback verdeutlicht, dass nicht alle Schülerin- 
nen und Schüler gleichermaßen von Feedback als Lernangebot profitieren (Hattie 
& Timperley, 2007; Wisniewksi et al., 2020). Zusätzlich wurde in Videostudien, die 
die Ausprägung von Feedback aus einer Beobachterperspektive untersuchen, auf- 
gezeigt, dass Lehrkräfte vermehrt einfache Feedbackdimensionen im schulischen 
Unterricht erteilen (u.a. Denn ct al., 2015; Krammer et al., 2010). In diesem Zusam- 
menhang muss allerdings berücksichtigt werden, dass das (aus „objektiver“ Sicht) 
erteilte Feedback der Lehrkraft nicht zwangsläufig mit der subjektiven Wahrneh- 
mung der Schülerinnen und Schüler übereinstimmt (Havnes et al., 2012; Hoya, 
2019). So muss beispielsweise ein von Beobachterinnen und Beobachtern identifi- 
zierte elaborierte und für den Lernprozess förderliche Form von Feedback im Un- 
terricht nicht gleichermaßen auch von Schülerinnen und Schülern als solche wahr- 
genommen und für die Verbesserung der Leistungen genutzt werden. 

Theoretisch wird angenommen, dass nicht nur Dimensionen der Feedbackge- 
staltung, sondern auch die Wahrnehmung und aktive Nutzung von Feedback des- 
sen Wirksamkeit beeinflussen (Kopp & Mandl, 2014a). Entsprechend zeigen schon 
ältere Forschungsergebnisse einer Metaanalyse von Bangert-Drowns et al. (1991), 
dass Feedback nur dann förderlich für den Lernprozess ist, wenn es bewusst wahr- 
genommen und bei der Aufgabenbearbeitung genutzt wird. Die Autoren sprechen 
in diesem Zusammenhang von „mindful reception (Bangert-Drowns et al., 1991, S. 
233), also einer bewussten Rezeption von Feedback (zsfd. Narciss, 2014). In Über- 
einstimmung dazu heben auch Rakoczy et al. (2013) die zentrale Rolle der Wahr- 
nehmung von Feedback hervor und unterscheiden in Anlehnung an Ilgen et al. 
(1979) zwischen vier Phasen der Wirksamkeit von Feedback auf die Verhaltensän- 
derung des Lernenden: „On a theoretical level they differentiated four stages in understanding 
how feedback results in behavior change: Feedback needs to (a) be perceived, (b) be accepted as 
accurate, (c) be perceived as useful, and (d) lead to actual behavior change (Rakoczy et al., 
2013, S. 64). 
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Diese Perspektive auf den Feedbackprozess lässt sich auch lerntheoretisch be- 
gründen. Vor dem Hintergrund einer konstruktivistischen Lerntheorie (Gersten- 
maier & Mandl, 1995; zsfd. Reinmann-Rothmeier & Mandl, 2006) wird Feedback 
als ein Lernangebot verstanden, mit dem sich Lernende aktiv auseinandersetzen und 
das sie in unterschiedlicher Weise für die Verbesserung des eigenen Lernprozesses 
nutzen (Knickenberg, 2018; Kopp & Mandl, 2014b; Krause, 2007; Krause et al., 
2004; Thurlings et al., 2013). Ob Lernende das angebotene Feedback wahrnehmen 
und nutzen, hängt im Wesentlichen von dem individuellen Lernpotenzial der Ler- 
nenden ab. 

Aus diesem Grund liegt der Fokus der neueren Feedbackforschung nicht mehr 
nur auf der Gestaltung von Feedback durch die Lehrkraft aus einer „objektiven“ 
Perspektive, sondern vermehrt auf der subjektiven Sicht der Lernenden als Adres- 
satinnen und Adressaten des Feedbacks (Brooks et al., 2019; Hoya, 2019; Knicken- 
berg, 2018; Lipnevich et al., 2016; Lipnevich & Panadero, 2021; Panadero & Lipne- 
vich, 2022; Van der Kleij & Lipnevich, 2021; Willems & Dreiling, 2022; Winstone 
et al., 2017). 


Interaktionales Rahmenmodell zur Gestaltung und Verarbeitung von Feedback (Strijbos & 
Miller, 2014) 


Eine differenzierte, theoretische Sichtweise auf das Zusammenspiel von individuel- 
len Merkmalen und dem Prozess der Wahrnehmung und Nutzung von Feedback 
bietet das interaktionale Rahmenmodell von Strijbos und Müller (2014). Die Auto- 
ren greifen auf bestehende Modelle zurück, in denen die individuelle Wahrnehmung 
und die individuellen Merkmale von Lernenden bei der Wirkungsweise von Feed- 
back berücksichtigt werden (u.a. Bangert-Drowns et al., 1991; Butler & Winne, 
1995; Hattie & Timperley, 2007; Kluger & DeNisi, 1996; Narciss, 2006, 2008; Shute, 
2008). Diese Modelle erweitern sie um eine starker interaktionsanalytische Perspek- 
tive. Das Rahmenmodell (vgl. Abbildung 3) nimmt dabei sowohl die Gestaltung 
von Feedback als auch dessen Verarbeitung und Nutzung durch die Lernenden in 
den Blick. Beide Prozesse werden durch komplexe Interaktionen zwischen Gestal- 
tungsmerkmalen des Feedbacks selbst, der Lernsituation sowie kognitiven und mo- 
tivationalen Merkmalen des Lernenden (u.a. Vorwissen, Selbstwirksamkeit, Zielori- 
entierungen) und des Lehrenden (u.a. Kompetenz) beeinflusst (Strijbos & Müller, 
2014). So ist es zum einen vorstellbar, dass Lernende ein Feedback aufgrund ihres 
Leistungsniveaus oder ihrer motivationalen Ausprägungen unterschiedlich wahr- 
nehmen. Das von der Lehrkraft erteilte Feedback wird dadurch sozusagen „ausge- 
siebt“ (Knickenberg, 2018, S. 19) und kann anders als von der Lehrkraft ursprüng- 
lich intendiert wahrgenommen und interpretiert werden (Strijbos & Müller, 2014). 
Dadurch können die Wahrnehmungen ein und desselben Feedbacks zwischen den 
Schülerinnen und Schülern einer Schulklasse je nach individuellen motivationalen 
und kognitiven Ausprägungen variieren und zu differenziellen motivationalen und 
kognitiven Effekten führen (Hoya, 2019; Knickenberg, 2018). Auf der anderen Seite 
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ist in Anlehnung an das interaktionale Modell von Strijbos und Müller (2014) auch 
vorstellbar, dass Lehrkräfte ihr Feedback in Abhängigkeit von den Bedürfnissen der 
Lernenden und ihren heterogenen Lernausgangslagen anpassen, d.h. dass auch die 
Gestaltung von Feedback durch die Lehrkraft von der Wahrnehmung und den 
Merkmalen der Lernenden beeinflusst werden kann. Folglich liefert das theoreti- 
sche Rahmenmodell einen wichtigen Beitrag zur Erklärung der differenziellen Wirk- 
samkeit von Feedback und verdeutlich die Komplexität von Feedbackprozessen im 
schulischen Unterricht. 


Lernkontext 


Wahrnehmung Merkmale des 
gate easly ane’ I und Verarbeitung }¢«——_J Lernenden als 
des Feedbacks Feedbackempfanger 
Rückkopplungsschleife 


Abbildung 3: Interaktionales Rabmenmodell der Gestaltung und Verarbeitung von Feedback (nach 
Strijbos & Müller, 2014; modifiziert durch die Autorin) 


Modell zur Interaktion zwischen Feedback und Lernenden (Lipnevich et al., 2016) 


Ein aktuelles theoretisches Modell, das sich explizit auf die Annahme stützt, dass 
Lernende eine aktive Rolle im Feedbackprozess einnehmen, stammt von Lipnevich 
et al. (2016; vgl. auch Lipnevich & Panadero, 2021). Das Modell (vgl. Abbildung 4) 
wurde in den Arbeiten von Van der Kleij & Lipnevich (2021) sowie Lipnevich & 
Smith (2022) weiterentwickelt. Einzelne Komponenten aus diesen erweiterten Mo- 
dellen wurden in Abbildung 4 aufgenommen. Im Modell steht die individuelle 
Wahrnehmung von und die Reaktion („Response“) auf das Feedback durch die Schü- 
lerinnen und Schüler im Mittelpunkt des gesamten Feedbackptozesses. Die zentrale 
Annahme ist, dass neben Merkmalen des spezifischen Lernkontextes, in dem das 
Feedback erteilt wird, insbesondere die individuellen Merkmale der Lernenden, wie 
das kognitive Fähigkeitsniveau und die Motivation, zu differenziellen Reaktionen 
auf das Feedback führen (Lipnevich et al., 2016; Lipnevich & Panadero, 2021). Da- 
bei können die Reaktionen auf das Feedback kognitive, affektive und verhaltensbe- 
zogene Prozesse des Lernenden umfassen. Zur kognitiven Reaktion gehört bei- 
spielsweise die Einschätzung, ob das Feedback verstanden wird. Die affektive Re- 
aktion kann Emotionen wie Freude oder Ärger über das erteilte Feedback umfas- 
sen. In den erweiterten Modellen von Van der Kleij & Lipnevich (2021) sowie Lip- 
nevich & Smith (2022) wird außerdem eine verhaltensbezogene Reaktion aufge- 
führt, die die weitere Nutzung des Feedbacks im Lernprozess betrifft. Kognitive, 
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affektive und verhaltensbezogene Reaktionen auf das Feedback können sich wech- 
selseitig beeinflussen. So wird der Lernende umso positiver auf ein Feedback rea- 
gieren, je besser er das Feedback versteht (Lipnevich et al., 2016). Diese Verarbei- 
tung wiederrum beeinflusst die konkreten Lernhandlungen bzw. die Nutzung von 
Feedback („Action“). Im erweiterten Modell von Lipnevich & Smith (2022) wird der 
Faktor Wirkungen („Outcome‘) auf die konkrete Leistung oder den Lernprozess er- 
gänzt. 


Individuelle Merkmale Reaktion Nutzung 
Feedback 

s vial 5 Kognitiv 

` er . Affektiv + Verbesserung 


Kognitive e Verhaltens- der Leistung/ des 


Fähigkeiten 
Wahrnehmung * Vomissen bezogen Lernprozesses 


Einstellungen zu 

« Nützlichkeit Feedback 
* Qualität * Motivation 
+ Spezifische Merkmale 

Feedbackgestaltung (z.B. 

Zeitpunkt, 

Verständlichkeit, 

Tönung) 


Lernkontext (z.B. Aufgabenstellung, Fach) 


Abbildung 4: Modell der Interaktion zwischen Feedback und Lernenden (nach Lipnevich et al., 2016 
und Lipnevich & Smith, 2022; übersetzt und modifiziert durch die Autorin) 


Alngebots-Nutzungs-Modell (Helmke, 2015; Vieluf et al., 2020) 


Neben theoretischen Modellen der Feedbackforschung dienen auch Angebots- 
Nutzungs-Modelle der pädagogisch-psychologisch orientierten Unterrichtsfor- 
schung (Helmke, 2015; Lipowsky, 2006; Reusser & Pauli, 2010; Seidel, 2014; Vieluf 
et al., 2020) als geeigneter theoretischer Rahmen zur Untersuchung der Wahrneh- 
mung von Feedback aus Sicht der Schülerinnen und Schüler (vgl. Abbildung 5). In 
Angebots-Nutzungs-Modellen wird Unterricht als Angebot von Lerngelegenheiten 
verstanden. Ob und inwiefern der Unterricht Veränderungen der kognitiven oder 
motivationalen Lernergebnisse von Schülerinnen und Schülern bewirkt, hängt nicht 
nur von der Qualität des Unterrichtsangebots selbst ab, sondern auch davon, wie 
Schülerinnen und Schüler das Angebot der Lehrkraft überhaupt wahrnehmen und 
interpretieren (Helmke, 2015). Vom Ausgang dieser Wahrnehmungsprozesse hängt 
ab, welche Lernaktivitäten (Nutzung) auf Seiten der Schülerinnen und Schüler re- 
sultieren. Die Wahrnehmung und Nutzung des Angebots stehen wiederum in Ab- 
hängigkeit von den individuellen Merkmalen und Dispositionen der Schülerinnen 
und Schüler. Unterricht wirkt sich demnach nicht automatisch oder bei allen Schü- 
lerinnen und Schülern in gleicher Weise auf den Lernerfolg aus. Vielmehr findet 
eine Interaktion zwischen dem Unterrichtsangebot (z.B. Feedback) und den Merk- 
malen von Schülerinnen und Schülern statt (Lipowsky, 2020; Vieluf et al., 2020). 
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Diese reziproke Beziehung wird in verschiedenen Angebots-Nutzungs-Modellen 
(Kleickmann et al., 2019; Lipwosky, 2020; Reusser & Pauli, 2010; Seidel, 2014; Vie- 
luf et al., 2020) durch in beide Richtungen weisende Pfeile zwischen dem Feld „Un- 
terrichtsangebot“ und dem Feld „Wahrnehmung und Nutzung“ des Unterrichtsan- 
gebots durch die Lernenden abgebildet (vgl. Abbildung 5). Die heterogenen Lern- 
voraussetzungen der Schülerinnen und Schüler bedingen, dass das gleiche Lernan- 
gebot von den Lernenden innerhalb einer Klasse unterschiedlich wahrgenommen 
wird und dies wiederrum zu differenziellen Nutzungen und Lernentwicklungen 
führt (Jurik et al., 2015; Seidel, 2006). Dabei stellt die Nutzung ebenfalls einen kom- 
plexen Prozess dar, in dem sich kognitive Prozesse (z.B. Verarbeitungstiefe) sowie 
emotionales und motivationales Erleben (z.B. Autonomie und Kompetenz) gegen- 
seitig beeinflussen (Jansen et al., 2022; Vieluf et al., 2020). 
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Abbildung 5: Vereinfachtes Angebots-Nutzungs-Modell (in Anlehnung an Kleickmann et al., 2019, $. 
209) 


Angelehnt an die Logik klassischer Angebots-Nutzungs-Modelle wird Feedback in 
dieser Arbeit als Unterrichtsmerkmal aufgefasst, das im Sinne eines Lernangebots 
von Schülerinnen und Schülern individuell wahrgenommen und genutzt wird und 
auf Basis dieser subjektiven Wahrnehmung und Nutzung differenzielle leistungs- 
und motivationsbezogene Wirkungen erzielen kann. 


2.5.2 Zur standardisierten Erfassung der Wahrnehmung von Feedback 


Im vorangegangenen Kapitel wurde die Bedeutung der individuellen Wahrnehmung 
von Feedback hervorgehoben, die beeinflusst, ob das Feedback genutzt wird und 
welche Wirkungen das Feedback entfaltet. Hierfür ist es zunächst einmal entschei- 
dend, zu klären, wie die Perspektive der Schülerinnen und Schüler auf das Feedback, 
das im Unterricht von der Lehrkraft erteilt wird, empirisch erfasst wird. Einschrän- 
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kend ist festzuhalten, dass sich die Studien in der Operationalisierung der Feedback- 
wahrnehmung und im methodischen Zugang sehr unterscheiden (zsfd. Van der 
Kleij & Lipnevich, 2021). Bei der folgenden Darstellung bestehender Instrumente 
zur Erfassung der Feedbackwahrnehmung wird daher zwischen unterschiedlichen 
Forschungssträngen unterschieden, die beeinflussen, wie die Wahrnehmung von 
Feedback methodisch operationalisiert wird. 


Instrumente in der Feedbackforschung 


In den letzten Jahren sind infolge des Perspektivwechsels der Feedbackforschung 
hin zum Feedback aus der Sicht der Lernenden (vgl. Lipnevich et al., 2016; Van der 
Kleij & Lipnevich, 2021; Winstone et al., 2017) zunehmend empirische Studien ent- 
standen, die die Wahrnehmung von Feedback fragebogenbasiert untersuchen. Da- 
bei liegt der Fokus der aktuellen Forschung auf unterschiedlichen Bereichen der 
Wahrnehmung, dazu gehören u.a.: 


e die Art und Weise, wie das Feedback von der Lehrkraft erteilt wird (feedback 
delivery, vgl. Kyaruzi et al., 2019), 

è die Nützlichkeit bzw. der Nutzung von Feedback (Brooks et al., 2019; Harks 
et al., 2014; Kyaruzi et al., 2019; Rakoczy et al., 2013; Rakoczy ct al., 2019; 
Strijbos et al., 2010; Strijbos et al., 2021) oder 

e die Akzeptanz von Feedback (Lipnevich & Lopera-Oquendo, 2022; Strijbos 
et al., 2010; Strijbos et al., 2021). 


So entwickeln Brooks et al. (2019) in Anlehnung an das Feedbackmodell von Hattie 
und Timperley (2007) den SFPQ-Fragebogen (,,S/adent Feedback Perception Question- 
naire") mit 31 Items zur Erfassung der wahrgenommenen Nützlichkeit von unter- 
schiedlichen Dimensionen von Feedback (u.a. die drei Ebenen Aufgabe, Prozess, 
Selbstregulation) aus der Sicht von Schülerinnen und Schülern. Zur Einschätzung 
sollen die Schülerinnen und Schüler auf einer fünfstufigen Skala angeben, wie hilf- 
reich sie die spezifische Ebene des Feedbacks finden. Allerdings wird nicht erfasst, 
ob und wie diese Dimensionen von Feedback im Unterricht aus der Sicht der Schü- 
lerinnen und Schülern ausgeprägt sind. 

Rakoczy et al. (2013), Rakoczy et al. (2019) und Harks et al. (2014) erfassen 
anhand einer Skala mit fünf Items die wahrgenommene Nützlichkeit von Feedback, 
das von der Lehrkraft im Mathematikunterricht erteilt wird. Konkret wurden die 
Schülerinnen und Schüler retrospektiv gefragt, inwiefern das Feedback ihnen ge- 
holfen hat, sich zu verbessern. Die Schülerinnen und Schüler wurden gebeten, ihre 
Zustimmung zu den unterschiedlichen Aussagen auf einer dreistufigen Skala anzu- 
geben. In den Analysen wurde die wahrgenommene Nützlichkeit von Feedback als 
Mediatorvariable zur Erklärung der Wirkung von erteiltem Feedback auf die Leis- 
tungs- und Interessensentwicklung eingesetzt. Aufgrund des experimentellen De- 
signs bleibt unklar, wie hoch die Dimensionen von Feedback (notenorientiert und 
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prozessorientiert) aus der Sicht der Schülerinnen und Schüler im Unterricht ausge- 
prägt sind. 

Lipnevich et al. (2020) entwickeln mit den RIF-Skalen („Reeiptivity to Instructional 
Feedback‘) einen Fragebogen zur differenzierten Messung der wahrgenommenen 
Akzeptanz von Feedback aus der Sicht von Schülerinnen und Schülern. Im Einzel- 
nen werden mit den eingesetzten Skalen vier Merkmale der wahrgenommenen Ak- 
zeptanz operationalisiert: 1) eine affektive Komponente (z.B. Freude über das Feed- 
back), 2) eine wertbezogene Komponente (z.B. Bewertung der Nützlichkeit von 
Feedback), 3) eine kognitive Komponente (z.B. Verständnis des Feedbacks) und 4) 
eine verhaltensbezogene Komponente (z.B. Verhalten in Bezug auf die Nutzung 
von Feedback). Die Schülerinnen und Schüler gaben ihre Zustimmung zur Ausprä- 
gung der unterschiedlichen Aussagen auf einer fünfstufigen Antwortskala an. Die 
latente, vierfaktorielle Struktur der Feedbackwahrnehmung konnte in unterschied- 
lichen Stichproben (USA, Neuseeland, Singapur) im schulischen und universitären 
Kontext bestätigt werden (Lipnevich et al., 2020; Lipnevich & Lopero-Oquendo, 
2022). Außerdem konnte die Messäquivalenz des Strukturmodells auch für unter- 
schiedliche Gruppen (Mädchen und Jungen) im Rahmen von Messinvarianzanaly- 
sen nachgewiesen werden. 

Ähnlich erfassen auch Strijbos et al. (2021) mit dem FPQ-Fragebogen („Feedback 
Perceptions Questionnaire; vgl. auch Strijbos et al., 2010) zwei übergreifende Kompo- 
nenten der Feedbackwahrnehmung, die wiederrum unterschiedliche Subkompo- 
nenten beinhalten: eine kognitive Komponente sowie eine motivationale Kompo- 
nente. Die kognitive Komponente bezieht sich auf die kognitive Funktion von 
Feedback und beinhaltet die drei Subkomponenten wahrgenommene Fairness, 
Nützlichkeit und Akzeptanz der Feedbackinformation. Die motivationale Kompo- 
nente bezieht sich auf die motivierende Funktion von Feedback und umfasst die 
zwei Subkomponenten wahrgenommene Bereitschaft, die Leistung infolge des 
Feedbacks zu verbessern, sowie affektive Reaktionen, die das Feedback beim Feed- 
backempfänger auslösen. Im Rahmen der psychometrischen Auswertungen weisen 
die Autoren für das Instrument sowohl Konstruktvalidität als auch Messinvarianz 
in Bezug auf unterschiedliche Gruppierungsvariablen (z.B. Geschlecht) nach. 

Zusammenfassend ist dem oben skizzierten Forschungsstand zu bestehenden 
Messinstrumenten zur Erfassung der Feedbackwahrnehmung zu entnehmen, dass 
auf der Ebene der Operationalisierung erfasst wird, wie Lernende auf Feedback re- 
agieren, wobei diese Reaktion als multidimensionales Konstrukt (u.a. kognitive, af- 
fektiv-motivationale Komponenten usw.) konzeptualisiert wird. Einen Indikator 
der kognitiven Komponente bildet dabei u.a. die wahrgenommene Nützlichkeit von 
Feedback (Strijbos et al., 2021). In diesem Zusammenhang fällt auf, dass in den 
dargestellten Studien nicht erfasst wird, wie Schülerinnen und Schüler die Ausprä- 
gung von Feedback wahrnehmen. Dabei ist theoretisch davon auszugehen, dass das 
Feedback bei den Schülerinnen und Schülern zunächst „ankommen“ muss, bevor 
es als nützlich oder hilfreich wahrgenommen und für konkrete Lernhandlungen ge- 
nutzt werden kann (Rakoczy et al., 2013). Insgesamt fehlt es folglich an empirischen 


Die Rolle der Wahrnehmung von Feedback 39 


Untersuchungen, die systematisch erfassen, wie Schülerinnen und Schüler die Aus- 
prägung von Feedback der Lehrkraft im Unterricht retrospektiv einschätzen. Damit 
einher geht auch die Frage, inwiefern unterschiedliche Dimensionen der Qualität 
der Feedbackgestaltung aus der Sicht von Schülerinnen und Schülern beschrieben 
werden können und wie diese Dimensionen der Feedbackqualität mit den Lerner- 
gebnissen zusammenhängen. 


Instrumente in der Unterrichtsforschung 


In der Unterrichtsforschung werden Einschätzungen von Schülerinnen und Schü- 
lern zum Unterricht oft dazu genutzt, die Dimensionen der Unterrichtsqualität dif- 
ferenziert zu beschreiben oder Zusammenhänge zwischen Unterrichtsmerkmalen 
und Lernergebnissen herzustellen (Stahns et al., 2020). Mit der Schülersicht auf das 
Unterrichtsgeschehen erhält man „authentische Berichte des individuellen Erle- 
bens“ (Waldis et al., 2010, S. 172) der Schülerinnen und Schüler. Schüleraussagen 
gelten als eine zuverlässige Datenquelle zur Beschreibung der Qualität des Unter- 
richts (Clausen, 2002; Göllner et al., 2021; Lüdtke et al., 2009; Kunter et al., 2007; 
Seidel et al., 2007; Wagner et al., 2013, Wagner et al., 2016; Waldis et al., 2010) und 
stehen nachweislich im Zusammenhang mit kognitiven und motivational-affektiven 
Zielkriterien des Unterrichts (u.a. Fauth et al., 2014; Göllner et al., 2018; Igler et al., 
2019; Kunter et al., 2013; Schiepe-Tiska et al., 2016; Stahns et al., 2020; Wagner et 
al., 2016; Willems, 2011, 2022b), wobei Unterschiede zwischen den Qualitätsdimen- 
sionen berücksichtigt werden müssen (Göllner et al., 2021). Ein Vorteil von Schü- 
lerbefragungen gegenüber Beobachtungen durch externe Raterinnen und Rater ist, 
dass Schülerinnen und Schüler den Unterricht einer Lehrkraft über einen längeren 
Zeitraum und in verschiedenen Situationen beobachtet haben und somit als Exper- 
tinnen und Experten des Unterrichts angesehen werden können (Baumert et al., 
2004; Clausen, 2002; Ditton, 2002; Göllner et al., 2016; Göllner et al., 2021; Wagner 
et al., 2016). Darüber hinaus können Schülereinschätzungen dazu genutzt werden, 
das Unterrichtsgeschehen differenziert zu beschreiben und die Trennung von un- 
terschiedlichen Dimensionen der Unterrichtsqualitat empirisch nachzuweisen 
(Fauth et al., 2014; Göllner et al., 2016; Stahns et al., 2020; Wagner et al., 2013). So 
analysierten Wagner et al. (2013) anhand der Daten der Studie Deutsch-Englisch- 
Schulleistungen International (DESI) die Schülerbeurteilungen des Unterrichts für 
die Fächer Deutsch und Englisch in 280 Schulklassen. Die Ergebnisse eines Mehr- 
ebenen-Strukturgleichungsmodells bestätigen u.a., dass Schülerinnen und Schüler 
unterschiedliche Dimensionen der Qualität des Deutsch- und Englischunterrichts 
(Schülermotivierung, Verständlichkeit, Schülerorientierung, Strukturiertheit und 
Klassenführung) differenziert beurteilen können, wobei die Trennung der fünf Di- 
mensionen nicht nur auf der Ebene „innerhalb der Klassen“ (nicht geteilte Wahr- 
nehmung), sondern auch „zwischen den Klassen“ (geteilte Wahrnehmung) empi- 
risch nachgewiesen wurde. Vor diesem Hintergrund sollen im Folgenden einzelne 
Studien vorgestellt werden, die an diese Forschungstradition angelehnt sind und 
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unterschiedliche Dimensionen der Feedbackqualität auf Basis von Schülerwahrneh- 
mungen untersuchen. 

Die meisten Studien erfassen die wahrgenommene Feedbackqualität häufig als 
eindimensionales Konstrukt. So wurde in der internationalen Schulleistungsstudie 
PISA 2015 die Häufigkeit von Feedback der Lehrkraft im naturwissenschaftlichen 
Unterricht aus der Sicht der Schülerinnen und Schülern erhoben (Bayer et al., 2016). 
Das Feedback wurde mittels fünf Items erfasst (Beispielitem: „Die Lehrkraft sagt 
mir, wie ich meine Leistungen verbessern kann“, Mang et al., 2019, S. 83). In der 
PISA-Studie 2018, in der das Feedback der Lehrkraft im Lese- bzw. Deutschunter- 
richt im Mittelpunkt stand, wurde die Skala sogar auf drei Items reduziert (Mang et 
al., 2021). Die Schülerinnen und Schüler wurden gebeten, die Aussagen auf einer 4- 
stufigen Likert-Skala von „nie oder fast nie“ bis „jede Stunde oder fast jede Stunde“ 
zu beantworten, wobei höhere Werte häufigere Rückmeldungen anzeigten. Im Rah- 
men konfirmatorischer Analysen der in PISA erhobenen Feedback-Skala diskutie- 
ren Vries et al. (2022) auch, dass Feedback ein komplexes Konstrukt ist und unter- 
schiedliche Dimensionen beinhaltet, die nicht mit nur fünf bzw. drei Items abgebil- 
det werden können. Stattdessen plädieren die Autoren dafür, unterschiedliche Di- 
mensionen von Feedback zu erfassen, die mit dem Lernerfolg der Schülerinnen und 
Schüler in Zusammenhang stehen. 

Auch die Studie von Sortker (2019) widmet sich der Untersuchung der Feed- 
backskalen, die in PISA 2012 aus der Perspektive der Schülerinnen und Schüler in 
naturwissenschaftlichen Fächern der Sekundarstufe I erhoben wurden. Sortker 
(2019) geht theoretisch von zwei Dimensionen von Feedback aus (vgl. Abschnitt 
2.2): 1) Ein direktives bzw. anleitendes Feedback (directive feedback), welches Infor- 
mationen von der Lehrkraft enthält, die den Lernenden dazu anleiten, wie die Leis- 
tung oder der Lernprozess verbessert werden kann (Beispielitem: „The teacher tells 
me what I need to do to become better in mathematics“ (Sortker, 2019, S. 735)) 
und 2) ein stärker selbstregulatives Feedback (facilitative feedback), welches durch Hin- 
weise zur eigenständigen Überwachung und Regulation des Lernprozesses anregt 
(Beispielitem: „The teacher asks us to explain how we have solved a problem“ (Sort- 
keer, 2019, S. 735)). Die Ergebnisse der konfirmatorischen Faktorenanalysen für un- 
terschiedliche Stichproben (nordische Staaten) weisen auf eine zweifaktorielle 
Struktur des wahrgenommenen Feedbacks auf der Grundlage von Schülereinschät- 
zungen hin. 

Bislang liegen nur wenige Untersuchungen vor, die die wahrgenommene Feed- 
backqualität multidimensional erfassen. Hoya (2019) untersucht die subjektiv wahr- 
genommene Häufigkeit von unterschiedlichen Dimensionen der Feedbackqualität 
aus der Sicht von Grundschulkindern im Leseunterricht (vgl. auch Knickenberg, 
2018). In seiner Studie setzt der Autor einen Fragebogen bestehend aus drei Sub- 
skalen zum wahrgenommenen einfachen (,,Lob“ und „Tadel“, sowie elaborierten 
(,,instruktionalen“) Feedback ein. Die Kinder wurden gebeten die Ausprägungen 
der verschiedenen Formen von Feedback anhand von insgesamt 18 Items auf einer 
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fünfstufigen Likertskala von „nie“ bis „sehr oft“ anzugeben. Im Rahmen von Fak- 
torenanalysen kann die Dimensionalität der drei Faktoren der Feedbackwahrneh- 
mung nachgewiesen werden (Hoya, 2019; Knickenberg, 2018). Allerdings erfassen 
die Autoren lediglich eine allgemeine Form von elaboriertem Feedback, obschon 
argumentiert wird, dass elaboriertes Feedback unterschiedliche Formen beinhalten 
kann. Die Ergebnisse aus Mehrebenen-Analysen zeigen, dass das Leseverständnis 
der Kinder auf der Individual- und Klassenebene signifikant durch das wahrgenom- 
mene negative und elaborierte Feedback erklärt werden kann. Da sich die Ergeb- 
nisse auf die Wahrnehmung von Grundschulkindern beziehen, können sie nicht 
ohne Weiteres auf den Kontext der vorliegenden Arbeit übertragen werden. 

Zum gegenwärtigen Zeitpunkt liegen nur die Untersuchungen von Dreiling et 
al. (2018) und Willems und Dreiling (2022) vor, die die wahrgenommene Ausprä- 
gung von unterschiedlichen Dimensionen der Feedbackqualität aus der Sicht von 
Schülerinnen und Schülern differenziert erfassen. In Anlehnung an die Forschungs- 
arbeiten von Hattie und Timperley (2007) zu effektivem Feedback im Schulunter- 
richt sowie Pauli (2006, 2010) zu Feedback als Merkmal eines produktiven Unter- 
richtsgesprächs entwickeln die Autorinnen vier Subskalen, die die theoretisch ange- 
nommenen Dimensionen Aufgaben-, Prozess-, Selbstregulations- und Dialogorien- 
tierung von Feedback abbilden (vgl. Abschnitt 2.2). Die Schülerinnen und Schüler 
werden konkret gefragt, wie sie die Ausprägung dieser Dimensionen von Feedback, 
das sie im Unterrichtsgespräch nach einem Beitrag oder einer Antwort erhalten, 
retrospektiv einschätzen. Im Rahmen von zwei Studien zur Qualität von Feedback 
im Deutschunterricht der Oberstufe weisen die Autorinnen das Modell mit vier 
Faktoren auf Basis der Einschätzungen der Schülerinnen und Schüler empirisch 
nach. Ungeklärt ist bislang, ob sich die Struktur des Modells für unterschiedliche 
Gruppen von Schülerinnen und Schülern (z.B. Geschlechtergruppen) und zu meh- 
reren Zeitpunkten (z.B. im Laufe eines Schuljahres) in gleicher Weise abbilden lässt. 
Außerdem bleibt offen, inwiefern die aus Schülersicht erfassten Dimensionen der 
Feedbackqualität mit der Leistungs- und Motivationsentwicklung der Schülerinnen 
und Schüler zusammenhängen. Insofern ist die Bedeutung des Modells von Feed- 
backqualität für den Deutschunterricht der Oberstufe noch nicht hinreichend nach- 
gewiesen. 


2.5.3 Empirische Befunde zur differenziellen Feedbackwahrnehmung 


Unterricht — und damit auch das Feedback — wird nicht von allen Schülerinnen und 
Schülern gleichermaßen wahrgenommen. Durch die individuellen Merkmale, die 
Schülerinnen und Schüler mitbringen, entstehen interindividuelle Unterschiede in 
ihren Unterrichtswahrnehmungen (Igler et al., 2019; Jurik et al., 2015; Schenke et 
al., 2018; Tsai et al., 2008; Willems, 20222; Willems & Dreiling, 2022; Willems et al., 
im Druck), die sich auch in unterschiedlichen Lernentwicklungen niederschlagen 
können. Nichtsdestotrotz ist bislang wenig darüber bekannt, inwiefern Schülerin- 
nen und Schüler aufgrund ihrer individuellen Merkmale das Feedback im Unterricht 
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unterschiedlich wahrnehmen (Gamlem & Smith, 2013; Havnes et al., 2012; Hoya, 
2021; Sortker, 2018, 2019) und noch weniger Studien widmen sich der Frage der 
differenziellen Feedbackwahrnehmungen im Deutschunterricht (Hoya, 2021). 


Geschlecht als Pradiktor 


Ein Merkmal, das sich als prädiktiv für differenzielle Unterrichts- und Feedback- 
wahrnehmungen im Deutschunterricht herausgestellt hat, ist das Geschlecht der Schü- 
lerinnen und Schüler (Ditton, 2002; Hoya, 2021; Jurik et al., 2015; Stang & McEl- 
vany, 2020; Wagner, 2008). Dabei finden sich insbesondere Belege für den Deutsch- 
unterricht der Grundschule und der Sekundarstufe I. So untersuchen Stang und 
McElvany (2020), ob zwischen Grundschülerinnen und Grundschülern systemati- 
sche Unterschiede in der Wahrnehmung von allgemeinen Basisdimensionen von 
Unterrichtsqualität (Klassenführung, kognitive Aktivierung und Unterrichtsklima) 
im Deutschunterricht bestehen. Die Autorinnen belegen anhand von Daten der In- 
ternationalen Grundschul-Lese-Untersuchung 2016 (IGLU), dass Mädchen das un- 
terstützende Unterrichtsklima — auch unter Kontrolle der individuellen Schülerleis- 
tung (Lesekompetenz) — positiver wahrnehmen als Jungen. Für den Deutschunter- 
richt der Sekundarstufe I konnte nachgewiesen werden, dass die Gesamteinschät- 
zung des Unterrichts bei Mädchen positiver ausfällt als bei Jungen (Jurik et al., 2015; 
Wagner, 2008). 

In Bezug auf Unterschiede in der Wahrnehmung von Feedback im Deutschun- 
terricht liegt die Studie von Hoya (2021) vor. Die Befragung von 665 Schülerinnen 
und Schülern der dritten und vierten Jahrgangsstufe zu dem aus ihrer Sicht wahrge- 
nommenen positiven und negativen Feedback ergab, dass Mädchen im Vergleich 
zu Jungen seltener negatives Feedback und häufiger positives Feedback ihrer Lehr- 
kräfte wahrnehmen. Der Geschlechtereffekt der Wahrnehmung von negativem 
Feedback bleibt auch unter Kontrolle der Leseleistung erhalten, nicht aber, wenn 
zusätzlich die intrinsische Lesemotivation und die Selbstkonzepte der Kinder kon- 
trolliert werden. Für die Wahrnehmung von positivem Feedback konnten unter 
Kontrolle der Leseleistung, der intrinsischen Lesemotivation und der lesebezoge- 
nen Selbstkonzepte der Kinder keine geschlechtsspezifischen Unterschiede mehr 
nachgewiesen werden. Der Autor argumentiert, dass Wahrnehmungsunterschiede 
stärker über die Leistung und motivationale Merkmale erklärt werden können als 
über das Geschlecht (Hoya, 2021). Einschränkend ist festzuhalten, dass sich die 
Studie auf den Primarbereich bezieht, sodass nicht zwangsläufig auf die Feedback- 
wahrnehmung an weiterführenden Schulen geschlossen werden kann. Außerdem 
werden keine Ergebnisse in Bezug auf geschlechtsspezifische Unterschiede in der 
Wahrnehmung von leistungsbezogenem Feedback (z.B. zur Aufgabe oder zum Pro- 
zess der Aufgabenbearbeitung) berichtet. 

Daneben wurden auch einige Fragebogenstudien zur Wahrnehmung von Feed- 
back aus der Sicht von Mädchen und Jungen im internationalen Raum durchge- 
führt. Eine norwegische Fragebogenstudie zeigt, dass Schüler der Sekundarstufe II 
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über eine höhere Qualität von Feedback im Unterricht unterschiedlicher Fächer 
berichten als Schülerinnen (Havnes et al., 2012). Die Qualität von Feedback wurde 
dabei über verschiedene Merkmale erfasst, wie beispielsweise Länge des Feedbacks, 
Informationen zum Leistungsstand, summativ versus formativ (Havnes et al., 
2012). Auf der Grundlage von Daten der PISA-Studie belegt Sortker (2018, 2019), 
dass die Wahrnehmung von Feedback über alle nordischen Staaten hinweg in Ab- 
hängigkeit des Geschlechts variiert, wobei Jungen berichten, häufiger Feedback 
zum Leistungsstand und zum Lernprozess im mathematisch-naturwissenschaftli- 
chen Unterricht zu erhalten als Mädchen. Auch nicht-domänenspezifische Unter- 
suchungen im internationalen Kontext belegen, dass Jungen häufiger negatives 
Feedback zu ihren Leistungen wahrnehmen als Mädchen (Chen et al., 2011), Mäd- 
chen hingegen berichten allgemein mehr leistungsbezogenes Feedback zu erhalten 
als Jungen (Carvalho et al., 2014). Im Rahmen der Validitätsprüfungen ihres Frage- 
bogens zu unterschiedlichen Dimensionen der Akzeptanz von Feedback aus Sicht 
von Schülerinnen und Schülern der Sekundarstufe I an Schulen in Singapur weisen 
Lipnevich und Lopera-Oquendo (2022) auch geschlechtsspezifische Unterschiede 
in der Feedbackwahrnehmung nach. Demzufolge nehmen Mädchen im Vergleich 
zu Jungen das Feedback der Lehrkraft insgesamt positiver wahr und berichten über 
eine höhere Bereitschaft, das Feedback zu nutzen. 


Leistung als Pradiktor 


Unterschiede in der Unterrichts- und Feedbackwahrnehmung können auch auf- 
grund des individuellen Lestungsniveaus der Schülerinnen und Schüler entstehen (Ig- 
ler et al., 2019; Hoya, 2021; Jurik et al., 2015; Seidel, 2006). Konkret wird davon 
ausgegangen, dass leistungsschwächere Schülerinnen und Schüler den Unterricht 
anders einschätzen als leistungsstärkere Schülerinnen und Schüler (Stang & McEl- 
vany, 2021). Entsprechend zeigen die empirischen Befunde, dass Unterschiede in 
der Wahrnehmung der Unterrichts- und Feedbackqualität im Deutschunterricht je 
nach Leistungsniveau bestehen. Ein (negativer) Zusammenhang zwischen der Vor- 
leistung (Deutschnote) und der Einschätzung des Unterrichtsmerkmals „Koopera- 
tion und Diskussion“ konnte für den Deutschunterricht der Sekundarstufe I aufge- 
zeigt werden, wonach leistungsschwächere Schülerinnen und Schüler die Koopera- 
tion und Diskussion im Unterricht positiver wahrnehmen als leistungsschwächere 
Schülerinnen und Schüler (Jurik et al., 2015). Dieser Befund steht allerdings im Wi- 
derspruch zu den Ergebnissen von Wagner (2008), der von einer positiveren indi- 
viduellen Unterrichtswahrnehmung von Schülerinnen und Schülern mit höheren 
Leistungszuwächsen beim Deutschtest berichtet. Auf Klassenebene hängen außer- 
dem bessere Deutschnoten am Ende des Schuljahres mit einer positiveren Unter- 
richtswahrnehmung zusammen (Wagner, 2008). Im Grundschulunterricht hängen 
das Vorwissen und die kognitiven Fähigkeiten der Schülerinnen und Schüler mit 
ihrer Einschätzung der kognitiven Aktivierung zusammen (Igler et al., 2019). Hoya 
(2021) konnte belegen, dass die Leseleistung von Grundschülerinnen und -schülern 
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eine stärkere Erklärungskraft für Unterschiede in der Wahrnehmung von positivem 
und negativem Feedback besitzt als ihr Geschlecht. Teilweise kann unter Hinzu- 
nahme der Leistung im Regressionsmodell kein signifikanter Effekt des Ge- 
schlechts mehr belegt werden (Hoya, 2021). Ähnlich wie Jurik et al. (2015), die für 
den Deutschunterricht nachweist, dass eine geringere Leistung mit einer positiveren 
Unterrichtseinschätzung einhergeht, zeigt auch Sortker (2018), dass Schülerinnen 
und Schüler mit einer geringeren Leistung im Naturwissenschaftstest über mehr 
Feedback berichten als Schülerinnen und Schüler mit einer besseren Leistung im 
Naturwissenschaftstest. Bei der Erfassung von zwei Dimensionen von Feedback in 
PISA 2012 zeigt sich außerdem, dass eine höhere Mathematikleistung mit einer ge- 
ringeren Wahrnehmung von direktivem Feedback (directive feedback) und einer höhe- 
ren Wahrnehmung von selbstregulativem Feedback (facilitative feedback) einhergeht 
(Sortker, 2019). Dieses Ergebnis könnte darauf hindeuten, dass Lehrkräfte ihr 
Feedbackverhalten im Sinne einer adaptiven Unterrichtsgestaltung anpassen und 
leistungsschwacheren Schülerinnen und Schülern mehr Unterstützung in Form von 
(direktivem) Feedback geben, welches konkrete Informationen zur Verbesserung 
des Lernprozesses liefert, während leistungsstarke Schülerinnen und Schüler stärker 
darin gefördert werden, ihren Lernprozess selbst zu kontrollieren (Sortker, 2018, 
2019). 


2.5.4 Veränderung der Wahrnehmung - theoretische Annahmen 


Neben interindividuellen Unterschieden in der Feedbackwahrnehmung in Abhän- 
gigkeit von Schülermerkmalen steht auch die Frage nach der zeitlichen Variabilität 
der wahrgenommenen Feedbackqualität im Fokus dieser Untersuchung. Damit ein- 
her geht zunächst die Frage, inwiefern die Unterrichtsqualität einer Lehrkraft nicht 
nur Veränderungen in der Lernentwicklung beeinflussen kann, sondern auch selbst 
einer Veränderung unterliegt (Göllner et al., 2016). In der Unterrichtsforschung 
wird die Annahme vertreten, dass Unterrichtshandeln einer Lehrkraft eine stabile 
Größe ist (Göllner et al., 2016). Ebenso wird angenommen, dass Schülereinschät- 
zungen der Unterrichtsqualität über die Zeit stabil sind, weshalb die Erfassung von 
Unterrichtsmerkmalen in vielen Studien entsprechend nur einmal erfolgt, um Aus- 
sagen über die „allgemeine“ Unterrichtsqualitat einer Lehrkraft zu machen (Wagner 
et al., 2016). Dabei wird für bestimmte Unterrichtsmerkmale — wie Klassenführung 
und konstruktive Unterstützung — eine höhere zeitliche Stabilität angenommen als 
für andere Unterrichtsmerkmale — wie kognitive Aktivierung —, die stärker von den 
Unterrichtsinhalten abhängig sind und sich somit von Unterrichtsstunde zu Unter- 
richtsstunde in ihrer Qualität unterscheiden können (Praetorius et al., 2014; Thom- 
men etal., 2021). 

Trotz der angenommenen Stabilität des unterrichtlichen Handelns einer Lehr- 
kraft über die Zeit, können Veränderungen der Unterrichtswahrnehmung nicht aus- 
geschlossen werden (Curby et al., 2011; Göllner et al., 2016; Karlen, 2016; Wagner 
et al., 2016) und sind aus unterschiedlichen Gründen anzunehmen: 
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Erstens sind auf der individuellen Ebene der Schülerinnen und Schüler Verände- 
rungen der Wahrnehmung des Unterrichts über die Zeit denkbar (Ruzek & 
Schenke, 2019). Entsprechend kommen auch Studien wie die von Wagner et al. 
(2016) zu dem Ergebnis, dass Varianzen in den Schülereinschätzungen der Unter- 
richtsqualität über die Zeit eher auf intraindividuelle Unterschiede in den Wahrneh- 
mungen einzelner Schülerinnen und Schüler (92% der Varianz) zurückzuführen 
sind als auf tatsächliche Unterschiede in der beobachteten Unterrichtsqualitätin den 
unterschiedlichen Klassen (8%). Diese intraindividuellen Unterschiede können 
dadurch entstehen, dass Schülerinnen und Schüler die Lerngelegenheiten des Un- 
terrichts in Abhängigkeit ihrer individuellen motivationalen, affektiven und kogni- 
tiven Merkmale unterschiedlich interpretieren (Ruzek & Schenke, 2019) — eine An- 
nahme, die auf theoretischen Angebots-Nutzungs-Modellen (vgl. Abschnitt 2.5.1) 
gründet. 

Zweitens können zeitliche Variabilitäten in den Wahrnehmungen durch den Zeit- 
raum der Befragung eintreten (Göllner et al., 2016; Wagner et al., 2016). Auf den 
Kontext der FeeHe-Studie angewendet kann eine Veränderung der Unterrichts- 
wahrnehmung dadurch hervorgerufen werden, dass der zweite Befragungszeitpunkt 
kurz vor Bekanntgabe der Halbjahresnoten stattfand. Dementsprechend ist es plau- 
sibel anzunehmen, dass es aufgrund der bevorstehenden Zeugnisnoten Schwer- 
punktverschiebungen des Unterrichts gab (Göllner et al., 2016), die sich auch im 
Feedbackverhalten der Lehrkraft äußern können. Gleichzeitig können sich auf- 
grund der bevorstehenden Zeugnisnoten auch die Bedürfnisse der Schülerinnen 
und Schüler an das Feedback und die Unterstützung der Lehrkraft ändern. Beides 
— das veränderte Lehrkrafthandeln und die veränderten Bedürfnisse der Schülerin- 
nen und Schüler — kann sich in einer Veränderung der Feedbackwahrnehmung nie- 
derschlagen. Außerdem spielt der Zeitraum, der zwischen den Messzeitpunkten der 
Untersuchung der Unterrichtswahrnehmung liegt, eine Rolle für die Veränderbar- 
keit: Ein kurzer Zeitraum der Untersuchung von einigen Tagen oder wenigen Wo- 
chen macht eine „wirkliche Veränderung der Unterrichtsqualität eher unwahr- 
scheinlich“ (Göllner et al., 2016, S. 72); während ein größerer Zeitraum von einem 
halben oder einem Jahr für die Abbildung von Veränderung geeigneter zu sein 
scheint (Göllner et al., 2016). 

Drittens stellt Unterricht ein komplexes Geschehen dar, das durch eine Vielzahl 
an Interaktionen zwischen der Lehrkraft und den Schülerinnen und Schülern ge- 
kennzeichnet ist. Entsprechend ist anzunehmen, dass unterschiedliche Faktoren der 
Lernumgebung und der individuellen Schülerinnen und Schüler dazu beitragen kön- 
nen, dass Lehrkräfte die Qualität ihres Unterrichtshandeln im Laufe eines Schuljah- 
res verändern können. So wäre denkbar, dass sie bestimmte Merkmale der Unter- 
stützung und Schülerorientierung — und dazu gehört auch das Erteilen von Feed- 
back - stärker in den Mittelpunkt ihres Unterrichtshandelns stellen, um auf die spe- 
zifischen Bedürfnisse der Schülerinnen und Schüler zu reagieren (Curby et al., 2011; 
Göllner et al., 2016). Insbesondere in der gymnasialen Oberstufe, in der die Fach- 
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kurse infolge des Kurswahlsystems auf unterschiedlichem Anforderungsniveau un- 
terrichtet werden, sind gewisse Schwerpunktsetzungen im Unterricht als Reaktion 
auf den jeweiligen Leistungsstand der Schülerinnen und Schüler zu erwarten. Diese 
Veränderung des unterrichtlichen Handelns einer Lehrkraft könnte sich auch in den 
Schülerwahrnehmungen widerspiegeln. 

Viertens können auch Kontextmerkmale zu Veränderungen der Wahrnehmung 
von Unterrichtsqualität führen. Mit den Kurswahlen beim Übergang in die gymna- 
siale Oberstufe können veränderte Bedürfnisse der Schülerinnen und Schüler ein- 
hergehen. Sie können das Anspruchsniveau selbst wählen und damit bis zu einem 
gewissen Grad über die Gestaltung des Lernangebots mitbestimmen. In empiri- 
schen Studien zum Kurswahlverhalten konnte nachgewiesen werden, dass Schüle- 
rinnen und Schüler vornehmlich Kurse mit erhöhtem Anforderungsniveau wählen, 
die ihren fachspezifischen Interessen und Fähigkeiten entsprechen (Koller et al., 
2000; Nagy et al., 2008; Eckert et al., im Druck). Mit diesen interessensgesteuerten 
Kurswahlen dürften auch veränderte Erwartungen und Bedürfnisse an das Lernan- 
gebot einhergehen, die sich auch in einer Veränderung der Wahrnehmung der Un- 
terrichtsqualitat im Laufe der Sekundarstufe II manifestieren könnten. 

Bei der Betrachtung von Veränderungen können zwei Dimensionen unterschie- 
den werden (Dietrich, 2019): (1) Auf der Ebene der inzraindividnellen Dimension wird 
die Wahrnehmung ein und desselben Schülers bzw. ein und derselben Schülerin zu 
verschiedenen Zeitpunkten untersucht. (2) Auf der Ebene der inzerindividnellen Di- 
mension werden die Unterschiede in den Wahrnehmungen zwischen den einzelnen 
Schülerinnen und Schülern zu verschiedenen Zeitpunkten betrachtet. Diese diffe- 
renzielle Sichtweise berücksichtigt die Variabilität in den Veränderungen und unter- 
sucht folglich, inwiefern die individuelle Veränderung der Wahrnehmung von der 
durchschnittlichen Veränderung aller Schülerinnen und Schüler abweichen und 
welche Faktoren ggf. interindividuelle Unterschieden im Veränderungsprozess er- 
klären können (Gruber et al., 2014). 

Im nachfolgenden Abschnitt werden empirische Befunde zu Veränderungen 
der Unterrichtswahrnehmung auf diesen beiden Ebenen vorgestellt. 


2.5.5 Empirische Befunde zur (differenziellen) Veränderung der 
Wahrnehmung 


Bisher liegen nur wenige Studien vor, die die zeitliche Stabilität und Veränderung 
der Wahrnehmung von Unterrichtsmerkmalen wie Feedback im Rahmen längs- 
schnittlicher Studien untersuchen. Diese Studien legen den Fokus meistens auf Ver- 
änderungen beim Übergang von der Grundschule in die Sekundarstufe I (Lazarides 
et al., 2019; Lazarides, Fauth et al., 2021; Maulana et al., 2013; Maulana et al., 2016; 
Praetorius et al., 2017) oder auf Veränderungen im Laufe der Sekundarstufe I (De 
Wit et al., 2010; Praetorius et al., 2017; Way et al., 2007). Dabei wird auf der Basis 
von Motivationstheorien (Stage-Einvironment-Fit-Theotie, Eccles et al., 1993; Eccles 
& Roeser, 2009; ‚Se/f-Determination-Theotie, Ryan & Deci, 2000, vgl. Abschnitt 3.2) 
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häufig argumentiert, dass die im Laufe der Sekundarstufe I beobachtete Abnahme 
in der Motivation von Schülerinnen und Schülern mit einer Abnahme in der Qua- 
lität des Unterrichts zusammenhängt, was insgesamt auf eine fehlende Passung zwi- 
schen den individuellen Bedürfnissen der Schülerinnen und Schüler (z.B. mehr so- 
ziale Eingebundenheit und Autonomie) und der Gestaltung der Lernumgebung hin- 
deutet (De Wit et al., 2010; Lazarides et al., 2019; Lazarides, Fauth et al., 2021; 
Maulana et al., 2016; Way et al., 2007). 

Beispielsweise konnten im Rahmen der TRAIN-Studie Veränderungen in der 
aus Schülersicht wahrgenommenen Unterstützung durch die (Mathematik-)Lehr- 
kraft (Lazarides et al., 2019; Lazarides, Fauth et al., 2021) sowie der Klarheit und 
des Klassenmanagements (Lazarides, Fauth et al., 2021) nach dem Ubergang von 
der Grundschule in die Sekundarstufe I nachgewiesen werden. Konkret weisen die 
Ergebnisse der Latent-Change-Analysen auf eine signifikante Abnahme der wahrge- 
nommenen Unterrichtsqualitätsmerkmale im Laufe des Schuljahres hin. In Über- 
einstimmung zeigen auch weitere (internationale) Studien eine Abnahme in der 
(wahrgenommenen) Unterrichtsqualität in der Sekundarstufe I (Maulana et al., 
2013; Maulana et al., 2016; Way et al., 2007; Reddy et al., 2003). Im Einzelnen konn- 
ten Maulana et al. (2016) in einer langsschnittlichen Studie mit Schülerinnen und 
Schülern im ersten Jahr der Sekundarstufe I an niederländischen Schulen nachwei- 
sen, dass die wahrgenommene Klarheit, das Klassenmanagement sowie die Steue- 
rung durch die Mathematik- und Englischlehrkräfte aus der Sicht der Schülerinnen 
und Schüler im Laufe eines Schuljahres sinken. Anhand von latenten Wachstums- 
kurvenmodellen weisen sie außerdem interindividuelle Unterschiede in der Verän- 
derung der Unterrichtswahrnehmung nach. Demnach sind das Geschlecht und das 
Leistungsniveau der Klassen bedeutsame Prädiktoren von differenziellen Wahrneh- 
mungen und Veränderungen der Unterrichtsqualität. Way et al. (2007) beschreiben 
in einer längsschnittlichen, domänenunspezifischen Studie an Schulen in den USA, 
dass die wahrgenommene Unterstützung durch die Lehrkraft in der Schule — auch 
unter Kontrolle des Geschlechts und des sozioökonomischen Status — zu Beginn 
der sechsten Jahrgangsstufe zwar hoch ausfällt, im Laufe der Sekundarstufe I aber 
sinkt. Interindividuelle Unterschiede in der Wahrnehmung der Unterstützung zum 
ersten Messzeitpunkt, nicht aber Unterschiede in der Veränderung der Wahrneh- 
mung, konnten durch das Geschlecht erklärt werden (Way et al., 2007). De Wit et 
al. (2010) weisen auch für den Übergang in die High Schoo/ (von Klasse 9 in Klasse 
10) mittels latenter Wachstumskurvenmodelle nach, dass die wahrgenommene Un- 
terstützung aus der Sicht der Schülerinnen und Schüler sinkt, wobei diese Verände- 
rung für Jungen stärker ausfällt als für Mädchen. 

Insgesamt verdeutlichen die Ergebnisse der längsschnittlichen Untersuchungen, 
dass sich das Lehrkraftverhalten in Bezug auf unterschiedliche Unterrichtsmerk- 
male aus der Sicht von Schülerinnen und Schülern im Laufe der Schulzeit verändern 
kann. Obwohl Befunde in Bezug auf die Veränderung der Feedbackwahrnehmung 
fehlen, können die Ergebnisse zu längsschnittlichen Entwicklungen von ähnlichen 
Konstrukten (z.B. Unterstützung) ein Hinweis darauf sein, dass eine Untersuchung 
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der Veränderung des Feedbackverhaltens aus der Sicht der Schülerinnen und Schü- 
ler inhaltlich aufschlussreich sein kann. Einschränkend ist festzuhalten, dass die 
meisten längsschnittlichen Untersuchungen zu Veränderungen in der wahrgenom- 
menen Unterrichtsqualitat fachunspezifisch sind (De Wit et al., 2010; Lazarides, 
Fauth et al., 2021; Way et al., 2007) und somit keine Rückschlüsse auf bestimmte 
Fächer zulassen. Zudem beziehen sich die bisherigen Ergebnisse häufig auf Verän- 
derungen der Unterrichtsqualität in der Sekundarstufe I, sodass eine Untersuchung 
im Deutschunterricht der Sekundarstufe II neue Erkenntnisse in diesem For- 
schungsbereich liefern kann. Veränderungen der Qualität des Unterrichts — im Spe- 
ziellen des Feedbacks — sind auch für diesen Lernkontext zu erwarten, da sich durch 
die Leistungsdifferenzierung und interessensgeleiteten Kurswahlen sowohl die Ge- 
staltung des Feedbacks durch die Lehrkraft als auch die Bedürfnisse der Schülerin- 
nen und Schüler an das Feedback der Lehrkraft ändern können. Beides kann sich 
in einer veränderten Wahrnehmung von Feedback aus der Sicht der Schülerinnen 
und Schüler widerspiegeln. 

Neben der Analyse der intraindividuellen Veränderung der Feedbackwahrneh- 
mung scheint es auch relevant, Prädiktoren (wie das Geschlecht und das Leistungs- 
niveau) einzubeziehen, welche interindividuelle Unterschiede in der Veränderung 
der Wahrnehmung erklären können (De Wit et al., 2010; Maulana et al., 2016). 


3 Feedback und Motivation 


Im Rahmen der vorliegenden Arbeit wird das übergreifende Ziel verfolgt, die Zu- 
sammenhänge der aus Schülersicht wahrgenommenen Feedbackqualität mit der 
Veränderung der intrinsischen Lernmotivation von Schülerinnen und Schülern im 
Deutschunterricht der gymnasialen Oberstufe zu untersuchen. Gegenstand des vor- 
liegenden Kapitels ist daher der theoretische und empirische Hintergrund zur Lern- 
motivation sowie deren Zusammenhang zu Feedback im Unterricht. Dazu gliedert 
sich das Kapitel wie folgt: Zunächst wird der motivationstheoretische Hintergrund 
dargelegt. Hierzu wird der Begriff der Lernmotivation definiert und deren Bedeu- 
tung für den Lernerfolg von Schülerinnen und Schüler herausgestellt (Abschnitt 
3.1). Ausgehend hiervon widmet sich Abschnitt 3.2 der Selbstbestimmungstheorie 
von Deci und Ryan (2000, 2002), wobei auch die postulierten Grundbedürfnisse 
nach Autonomie, Kompetenz und sozialer Eingebundenheit thematisiert werden. 
Sodann werden in Abschnitt 3.3 aktuelle empirische Befunde zur Entwicklung der 
selbstbestimmten Motivation näher erörtert. Vor dem Hintergrund des Ziels der 
vorliegenden Arbeit werden in Abschnitt 3.4 theoretische Bezüge und empirische 
Befunde zum Zusammenhang zwischen Feedback und der intrinsischen Lernmoti- 
vation diskutiert. Im Einzelnen widmet sich Abschnitt 3.4.1 der Bedeutung von 
Feedback im Unterricht für die Entwicklung der intrinsischen Motivation im Kon- 
text der Selbstbestimmungstheorie. In Abschnitt 3.4.2 wird im Rahmen von theo- 
retischen Angebots-Nutzungs-Modellen und aktuellen empirischen Befunden der 
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Unterrichtsforschung auf das reziproke Verhältnis zwischen der Feedbackwahrneh- 
mung und der intrinsischen Lernmotivation sowie deren Veränderungen im Laufe 
der Schulzeit eingegangen. 


3.1 Konzeption von Lernmotivation und Bedeutung für 
das Lernen 


Die Motivation von Schülerinnen und Schülern gilt als eine wichtige Voraussetzung 
für positive Lernentwicklungen (Cerasoli et al., 2014; Spinath & Spinath, 2005; Wig- 
field & Cambria, 2010) und wird daher neben fachlichen und überfachlichen Kom- 
petenzen als eigenständiges Ziel der schulischen Bildung deklariert (Kunter, 2005; 
Rakoczy et al., 2022; Willems, 2011). Ein effektiver Unterricht schlägt sich demnach 
nicht nur in den kognitiven Lernergebnissen wieder, sondern ist auch durch eine 
erhöhte Lernmotivation gekennzeichnet (Kunter, 2005). Im schulischen Kontext 
wird die Lernmotivation als die individuelle Bereitschaft verstanden, zielgerichtet 
Lernhandlungen aufzunehmen und aufrechtzuerhalten (Krapp et al., 2014; Schie- 
fele et al., 2018; Schiefele & Schaffner, 2020; Willems, 2018). Ausgehend von dieser 
Konzeption und je nach Art der intendierten Ziele kann zwischen der intrinsischen 
und der extrinsischen Lernmotivation differenziert werden (Ryan & Deci, 2000, 
2017, 2020). Die intrinsische Motivation beschreibt den Wunsch oder die Absicht, 
eine bestimmte Lernhandlung auszuführen, weil damit positive Erlebensaspekte 
(u.a. Freude und Spaß) verbunden sind. Weiterhin kann zwischen einer tätigkeits- 
zentrierten und gegenstandszentrierten Form der intrinsischen Motivation unter- 
schieden werden (Schiefele & Streblow, 2005; Schiefele et al., 2018; Schiefele & 
Schaffner, 2020). Die tarigkeitszentrierte Form ist dadurch gekennzeichnet, dass Ler- 
nende eine Lernhandlung ausführen, weil sie Freude an einer bestimmten Aktivität 
(z.B. Lesen) zeigen. Die gegenstandszentrierte Form der intrinsischen Motivation cha- 
rakterisiert Lernende, die Interesse an dem Lerngegenstand (z.B. Thema eines Tex- 
tes) zeigen. Allerdings konnte die Trennung zwischen diesen theoretisch angenom- 
menen Komponenten der intrinsischen Motivation empirisch nicht belegt werden, 
was dafür spricht die intrinsische Motivation als einheitliches Konstrukt zu betrach- 
ten (vgl. Schiefele & Schaffner, 2020). 

Im Gegensatz zur intrinsischen Motivation wird extrinsisch motiviertes Lernen 
als der Wunsch oder die Absicht aufgefasst, eine Lernhandlung auszuführen, weil 
damit positive Folgen herbeigeführt oder negative Konsequenzen (z.B. schlechte 
Noten) vermieden werden können (Ryan & Deci, 2000). Für den schulischen Kon- 
text wird angenommen, dass die intrinsische Lernmotivation aufgrund von curticu- 
laren Anforderungen, die den Lernenden von außen vorgegeben werden, nicht die 
dominante Motivationsqualität darstellt (Kunter, 2005). Umso bedeutsamer er- 
scheint es, dass der Unterricht so gestaltet ist, dass er es den Lernenden ermöglicht, 
sich mit den Inhalten und Zielen des Unterrichts zu identifizieren und schließlich 
intrinsische Motivation zu entwickeln (Rakoczy et al., 2008; Rakoczy et al., 2022). 
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Im schulischen Kontext zeigt sich insbesondere die intrinsische bzw. selbstbe- 
stimmte Motivation als förderlich für erfolgreiche Lernprozesse. Entsprechend fin- 
den sich auch zahlreiche empirische Belege für den positiven Zusammenhang zwi- 
schen der intrinsischen Motivation und der schulischen Leistung (u.a. Burton et al., 
2006; Hayenga & Corpus, 2010; Lepper et al., 2005). Demgegenüber wurden für die 
extrinsische Motivation vereinzelt sogar negative Leistungseffekte nachgewiesen 
(Corpus et al., 2009; Hayenga & Corpus, 2010; Lepper et al., 2005; Taylor et al., 
2014). Neben dem Einfluss auf kognitive Merkmale geht die intrinsische Motivation 
auch mit einer höheren Ausdauer und Intensität bei der Bearbeitung von Lernauf- 
gaben einher (Vallerand et al., 1997; Vollmeyer & Rheinberg, 2000) und fördert den 
Einsatz von Lernstrategien, die mit einer tieferen Verarbeitung der Lerninhalte ein- 
hergehen (Pintrich & Groot, 1990; Schiefele & Schreyer, 1994; Walker et al., 2006). 
Die intrinsische Motivation ist auch für den Deutschunterricht besonders relevant. 
So wird beispielsweise davon ausgegangen, dass eine hohe Motivation für das Lesen 
im Deutschunterricht das Leseverhalten (im Sinne der Lesemenge bzw. Lesehäufig- 
keit) auch außerhalb des Deutschunterrichts begünstigt, was sich positiv auf die Le- 
sekompetenz auswirkt (Guthrie & Wigfield, 1999; McElvany et al., 2008; Möller & 
Schiefele, 2004). Die Lesekompetenz wiederrum beeinflusst nicht nur den schuli- 
schen Lernerfolg, sondern ist auch eine über den schulischen Kontext hinausge- 
hende wichtige Voraussetzung für den beruflichen Erfolg sowie die Bewältigung 
des alltäglichen Lebens (McElvany et al., 2008). Mit Blick auf die Ergebnisse inter- 
nationaler Schulleistungsstudien wie PISA des Jahres 2018 sowie IGLU des Jahres 
2016 zeigt sich allerdings, dass die intrinsische Motivation im Deutschunterricht 
vergleichsweise gering ausgeprägt ist (Diedrich et al., 2019; Goy et al., 2017). 


3.2 Die Selbstbestimmungstheorie 


Ein theoretischer Ansatz zur Erklärung der Entwicklung der intrinsischen Motiva- 
tion bei Lernenden ist die Selbstbestimmungstheorie (Se/f-Deiermination-Theory, SDT; 
Deci & Ryan, 1993, 2000; Ryan & Deci, 2000, 2017, 2020). In der SDT werden 
verschiedene Formen oder Qualitäten der Motivation unterschieden, die hinsicht- 
lich des subjektiv wahrgenommenen Orts der Handlungssuche (internal vs. exter- 
nal) und somit im Grad der wahrgenommenen Selbst- oder Fremdbestimmtheit 
variieren (Deci & Ryan, 2000, 2020). Je nach Grad der erlebten Selbstbestimmung 
können die Qualitäten der Motivation auf einem Kontinuum abgebildet werden, 
wobei die intrinsische und die extrinsische Motivation die äußeren Pole des Moti- 
vationskontinuums darstellen (vgl. Abbildung 6). 
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Abbildung 6: Motivationsformen, Regulationsstile und erlebte Selbstbestimmung (Buff et al., 2010, 
S. 257 in Anlehnung an Ryan & Deci, 2000, 2002) 


Während sich intrinsisch motiviertes Handeln durch eine hohe Ausprägung der 
Selbstbestimmung auszeichnet, ist extrinsisch motiviertes Handeln durch die ge- 
ringste Ausprägung der Selbstbestimmung gekennzeichnet. Bei der extrinsischen 
Motivation gibt es aber auch unterschiedliche Abstufungen — von gänzlich fremd- 
bestimmter, von außen kontrollierter externaler Regulation bis hin zur stärker 
selbstbestimmten, integrierten Regulation (Schiefele & Schaffner, 2020). Diese vier 
Stufen, die als external, introjizierte, identifizierte und integrierte V erhaltensregulation be- 
zeichnet werden, unterscheiden sich nach ihrem jeweiligen Grad der wahrgenom- 
menen Fremd- bzw. Selbstbestimmung (Deci & Ryan, 2000, 2002; Ryan & Deci, 
2020): 


© Die externale Regulation ist durch das höchste Ausmaß der Fremdbestimmung 
gekennzeichnet. Das Verhalten wird ausschließlich durch externe Hand- 
lungsziele reguliert. Ein Schüler bzw. eine Schülerin erfüllt eine Lernhand- 
lung nur, um eine Belohnung (z.B. gute Note) zu erhalten oder negative Kon- 
sequenzen (z.B. schlechte Note) zu vermeiden. 

© Die introjizierte Regulation ist eine eher fremdbestimmte Form der extrinsi- 
schen Motivation und liegt vor, wenn eine Person ein Handlungsziel verfolgt, 
ohne sich damit persönlich zu identifizieren bzw. diese als persönlich wichtig 
zu erachten. Ein Schüler bzw. eine Schülerin erfüllt Lernhandlungen nur, um 
beispielsweise den Erwartungen der Eltern oder der Lehrkraft zu entspre- 
chen oder von den Mitschülerinnen und -schülern anerkannt zu werden. 

© Die identifizierte Regulation ist eine stärker selbstbestimmte Form der extrinsi- 
schen Motivation und liegt vor, wenn Lernende die ursprünglich von außen 
vorgegeben Lernziele als persönlich wichtig erachten und sich damit identi- 
fizieren. Beispielsweise übt ein Schüler bzw. eine Schülerin eine Lernhand- 
lung aus, um später eine bestimmte Ausbildung machen zu können. Aller- 
dings kann die Lernhandlung weiterhin unverbunden im Selbstkonzept der 
Lernenden repräsentiert sein. 
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© Die integrierte Regulation stellt die höchste Auspragungsform der auf Selbstbe- 
stimmung beruhenden extrinsischen Motivation dar. Sie ist dadurch gekenn- 
zeichnet, dass sich Lernende nicht nur mit ursprünglich external bestimmten 
Lernzielen und Aufgabenstellungen identifizieren, sondern diese auch in Ein- 
klang mit persönlichen Zielen und Werten bringen und ohne Konflikte mit 
anderen persönlichen Zielen in ihr Selbstkonzept integrieren (Krapp et al., 
2014; Schiefele & Schaffner, 2020). Die integrierte Regulation weist eine 
hohe Ähnlichkeit zur intrinsischen Motivation auf, allerdings wird sie als 
extrinsische Motivationsform betrachtet, da die Handlung nicht eigeninitiiert 
ist (wie bei der intrinsischen Motivation), sondern ursprünglich von außen 
vorgegeben wurde (Deci & Ryan, 2000; Willems, 2011). 


Personenzentrierte Untersuchungen, in denen die wechselseitigen Einflüsse verschie- 
dener Motivationsformen in Form von latenten Profilen betrachtet werden, zeigen, 
dass fremdbestimmte und selbstbestimmte Motivationsformen sich nicht gegensei- 
tig ausschließen (Ratelle et al., 2007; Willems & Dreiling, 2022; Wormington et al., 
2012; Dreiling & Willems, im Druck). Vielmehr können sie innerhalb von Lernen- 
den zeitgleich auftreten. Im Hinblick auf den Lernerfolg ist das Verhältnis dieser 
beiden Motivationsqualitäten entscheidend: Die Studien weisen dabei übereinstim- 
mend nach, dass Lernende mit einem Motivationsprofil, das durch ein hohes Maß 
an selbstbestimmter Motivation gekennzeichnet ist, über höhere Ausprägungen 
lernrelevanter Merkmale (wie z.B. Schulleistung, Prüfungsangst, Schulzufriedenheit, 
Anstrengungsbereitschaft, Verarbeitungstiefe) verfügen als Schülerinnen und Schü- 
ler mit einem Motivationsprofil, bei dem die fremdbestimmte Motivation höher 
ausgeprägt ist (Ratelle et al., 2007; Vansteenkiste et al. 2009; Wormington et al. 
2012). 

Aus pädagogischer Sicht kann die Entwicklung oder Transformation von eher 
fremdbestimmten Formen der extrinsischen Motivation hin zu stärker selbstbe- 
stimmten Formen der Lernmotivation, die mit Prozessen der Internalisierung und 
Integration von Handlungszielen verknüpft sind (Ryan & Deci, 2000), „von außen“ 
gefördert werden, z.B. durch die Gestaltung der Lernumgebung und ein unterstüt- 
zendes Lehrkraftverhalten. Die Wirkung der Lernumgebung auf die Entwicklung 
der intrinsischen oder selbstbestimmten Motivation vom Lernenden wird im Rah- 
men der SDT durch die Erfüllung der grundlegenden Bedürfnisse, den basic needs 
erklärt (Deci & Ryan, 1993; Deci & Ryan, 2002; Ryan & Deci, 2000): 


e Das Autonomieerleben äußert sich im Bestreben des Lernenden, über die Ziele, 
Inhalte und Anforderungen von Lernaufgaben mitbestimmen zu können. 

© Das Kompetenzerleben äußert sich durch den Wunsch des Lernenden, die An- 
forderungen von Aufgabenstellungen aus eigener Kraft bewältigen zu kön- 
nen und noch fehlende Kompetenzen erwerben zu können. 
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e Schließlich hat der Lernende das Bestreben nach sozialer Eingebundenheit, also 
dem Gefühl, von seinen Mitschülerinnen und Mitschülern sowie seiner Lehr- 
kraft akzeptiert und anerkannt zu sein (Krapp et al., 2014). 


Lernkontexte unterscheiden sich darin, inwiefern sie die Erfüllung der drei Grund- 
bedürfnisse unterstützen. Eine Lernumgebung, in der Lernende sich selbst als kom- 
petent erleben, sich dabei in ihren Wahlmöglichkeiten und Entscheidungen auto- 
nom erleben können und sich gleichzeitig als Teil einer Lerngruppe wahrnehmen, 
ermöglicht es dem Lernenden, sich mit Inhalten und Lernzielen zu identifizieren 
und schließlich selbstbestimmte Formen der Motivation zu entwickeln (Rakoczy et 
al., 2022). Entsprechend finden sich empirische Belege dafür, dass Schülerinnen 
und Schüler, die eine hohe Ausprägung von Kompetenz- und Autonomieunterstüt- 
zung durch die Lehrkraft wahrnehmen und sich zur Klasse zugehörig füllen, auch 
über eine höhere selbstbestimmte Motivation berichten (Lazarides ct al., 2015; Nto- 
umanis et al., 2009; Rakozcy et al., 2022; Rakoczy, Klieme & Pauli, 2008). 

Des Weiteren konnte die vermittelnde Rolle der (wahrgenommenen) Erfüllung der 
Bedürfnisse nach Kompetenz und Autonomie für den Zusammenhang zwischen 
Unterrichtsmerkmalen und der selbstbestimmten Motivation von Lernenden in un- 
terschiedlichen Fächern bereits empirisch nachgewiesen werden (z.B. Mouratidis et 
al., 2013; Rakoczy et al., 2013; Rakoczy ct al., 2022; Ruzck et al., 2016). Dabei wird 
das motivationsrelevante Kompetenz- und Autonomieerleben als Mediatorvariab- 
len in die statistischen Analysen einbezogen (Jansen et al., 2022; Lederberger, 2015; 
Lepper et al., 2022; Rakoczy, 2008; Rakoczy et al. 2013; Rakoczy et al., 2022; Wil- 
lems, 2011). Diese Modellierung basiert auf Annahmen von theoretischen Ange- 
bots-Nutzungs-Modellen, in denen neben kognitiven Lernaktivitäten auch das mo- 
tivationsrelevante Selbstbestimmungserleben der Angebotsnutzung zugeordnet 
werden, die wiederum den Zusammenhang zwischen der Unterrichtsqualität und 
dem Lernen mediiert (Klieme & Rakoczy, 2008; Seidel, 2014; Vieluf et al., 2020). 


3.3 Empirische Befunde zur Entwicklung der 
Lernmotivation 


Trotz der Bedeutung der intrinsischen Motivation für das Lernen zeigen nationale 
und internationale Studien wiederholt, dass die durchschnittliche fachspezifische 
Lernmotivation von Schülerinnen und Schülern, aber auch die allgemeine schulbe- 
zogene Motivation im Laufe der Schulzeit sinkt (national: u.a. McElvany et al., 2008; 
Lazarides et al., 2019; Spinath & Spinath, 2005; Spinath & Steinmayr, 2008; interna- 
tional. u.a. Corpus et al., 2009; Gnambs & Hanfstingl, 2015; Gottfried et al., 2001; 
Gottfried et al., 2007; Jacobs et al., 2002; Lepper et al., 2005; Otis et al., 2005). 
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Veränderungen in der Ausprägung der intrinsischen Lernmotivation können 
vor allem in Übergangsphasen beobachtet werden — dabei ist die Abnahme der 
intrinsischen Motivation insbesondere für den Übergang von der Grundschule in 
die Sekundarstufe I gut belegt (Dietrich et al., 2015). In einer internationalen Studie 
in den USA berichten Otis et al. (2005) außerdem von einem Motivationsabfall beim 
Übergang von der Junior Higb School (Klassenstufe 8) in die Senior High School (Klas- 
senstufe 9 und 10), was in etwa vergleichbar mit dem Übergang von der Sekundar- 
stufe I in die Sekundarstufe II ist. Gleichzeitigt zeigt sich, dass die Entwicklung der 
Lernmotivation mit höherem Alter — ab ca. 16 Jahren — durch Stagnation geprägt 
ist, d.h. deutliche Veränderungen treten hier nicht mehr auf (Gottfried et al., 2001; 
Gottfried et al., 2007; Jacobs et al., 2002; Spinath & Steinmayr, 2012). Gottfried et 
al. (2007) weisen nach, dass sich die mathematikbezogene, intrinsische Motivation 
von Schülerinnen und Schülern ab dem Alter von 16 Jahren nicht mehr so stark 
verändert; im Vergleich zur starken Abnahme in den jüngeren Jahren. Dieser Trend 
wurde auch für den Deutschunterricht belegt: In einer Oberstufenstudie von Spi- 
nath und Steinmayr (2012), in der bei Schülerinnen und Schülern zu Beginn und am 
Ende der 11. Jahrgangsstufe u.a. die Motivation für das Lernen im Fach Deutsch 
erfasst wurde, zeigt sich in Übereinstimmung mit den genannten internationalen 
Befunden, dass sich die durchschnittliche intrinsische Motivation in diesem Zeit- 
raum nicht mehr bedeutsam verändert. 

Neben diesen Befunden, die eher die durchschnittliche Entwicklung der Moti- 
vation bei allen Schülerinnen und Schülern untersuchen, finden sich auch Belege, 
die Unterschiede zwischen unterschiedlichen Gruppen von Schülerinnen und Schü- 
lern aufzeigen. So treten differenzielle Entwicklungsverläufe in der Lernmotivation 
in Abhängigkeit des Geschlechts auf. Im Fach Deutsch entwickelt sich die Motiva- 
tion im Zeitverlauf bei Jungen tendenziell ungünstiger als bei Mädchen (Schwabe et 
al., 2021). Außerdem weist eine Vielzahl von Studien mit einer personenzentrierten For- 
schungsrichtung nach, dass Motivationsverläufe über die Zeit in Abhängigkeit des 
jeweiligen „Motivationsprofils“ bzw. „Motivationstyps“ der Schülerinnen und 
Schüler unterschiedlich verlaufen (Corpus & Wormington, 2014; Hayenga & Cor- 
pus, 2010; Lazarides et al., 2020; Marcoulides et al., 2008; Dreiling & Willems, im 
Druck). Spezifische Befunde für die Oberstufe verdeutlichen dabei eine hohe Sta- 
bilität der Motivationsprofile, was konkret bedeutet, dass Schülerinnen und Schüler 
ihr Motivationsprofil im Laufe der Schulzeit nicht mehr wesentlich wechseln (La- 
zarides et al., 2020; Marcoulides et al., 2008; Dreiling & Willems, im Druck). Auf 
der anderen Seite treten für einzelne Oberstufenschülerinnen und -schüler auch 
noch systematische Veränderungen in der ProfilzugehGrigkeit auf, wobei sie eher in 
Profile mit ungünstigen Ausprägungen in motivationalen Merkmalen wechseln 
(Dreiling & Willems, im Druck). Diese Schülerinnen und Schüler — auch als Profil- 
wechsler oder mover bezeichnet — folgen also dem Trend der Abnahme der intrinsi- 
schen Motivation (Dreiling & Willems, im Druck). In der Studie konnten außerdem 
geschlechtsspezifische Unterschiede in der Motivationsentwicklung nachgewiesen 
werden. Die Geschlechtsunterschiede in der Profilzugehörigkeit verstärkten sich 
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über die Zeit: Mädchen waren im Vergleich zu Jungen weniger wahrscheinlich dazu 
geneigt, in ein Profil mit geringerer intrinsischer Motivation zu wechseln und sie 
konnten mit höherer Wahrscheinlichkeit über die Zeit ein Profil mit hoher intrinsi- 
scher Motivation aufrechterhalten (Dreiling & Willems, im Druck). Auch in einer 
anderen personenzentrierten Untersuchung wurde beschrieben, dass Schülerinnen 
im Laufe der Sekundarstufe II mit höherer Wahrscheinlichkeit in Profile mit hoher 
Motivation in Bezug auf sprachliche Fächer wechseln als Schüler (Lazarides, Dicke 
et al., 2021). 

Darüber hinaus konnten znterindividnelle Unterschiede in der intraindividnellen Mo- 
tivationsveränderung über die Zeit in längsschnittlich angelegten variablenzentrierten 
Untersuchungen nachgewiesen werden. Diese verdeutlichen, dass die Veränderung 
der Lernmotivation nicht bei allen Schülerinnen und Schülern gleichermaßen auf- 
tritt (Gottfried et al., 2007; Gottfried et al., 2017; Spinath & Steinmayr, 2008; Wei- 
dinger et al., 2015). Aus methodischer Sicht kommen dabei häufig Formen der 
längsschnittlichen Strukturgleichungsmodellierung, wie Latent Change Modeling 
(LCM) oder Latent Growth Modeling (LGM), zur Anwendung. Gottfried et al. (2007) 
untersuchten die Motivationsentwicklung bei Kindern und Jugendlichen im Alter 
von 9 bis 17 Jahren im Fach Mathematik. Mittels LGM konnten sie aufzeigen, dass 
die intrinsische Motivation im Laufe der Schulzeit sinkt. Allerdings verweisen die 
signifikanten Varianzen in der Ausgangsmotivation und der latenten Veränderungs- 
variable auf Unterschiede zwischen den Schülerinnen und Schülern. Vertiefende 
Analysen zeigten, dass die Mathematikleistung der Schülerinnen und Schüler ein 
bedeutsamer Prädiktor der Motivationsveränderung im Laufe der Schulzeit ist. Die 
Schülerinnen und Schüler entwickelten sich also in Abhängigkeit ihrer Leistung im 
Fach Mathematik unterschiedlich. Geringe Mathematikleistungen scheinen mit ei- 
ner Abnahme in der intrinsischen Motivation einherzugehen (Gottfried et al., 2007). 

Auch für das Fach Deutsch konnten interindividuelle Unterschiede in der zeit- 
lichen Entwicklung der intrinsischen Motivation für Schülerinnen und Schüler 
nachgewiesen werden; allerdings beziehen sich die Ergebnisse auf die Primarstufe 


(Weidinger et al., 2015). Weidinger et al. (2015) berichten, dass die durchschnittliche 
intrinsische Motivation vom Beginn der 3. bis zum Ende der 4. Klassenstufe zwar 
sinkt, aber mittels LGM weisen sie auch Unterschiede zwischen den Kindern in der 
Motivationsabnahme nach. In der Untersuchung konnten die Autorinnen nur ge- 
ringe Effekte der Deutschnote auf die Veränderung der intrinsischen Motivation 
beobachten. 

Zusammenfassend zeigt der Forschungsstand, dass die intrinsische Motivation ab 
dem Alter von 16 Jahren stabil bleibt. Dieser Befund bezieht sich aber auf die mitt- 
lere Ausprägung der intrinsischen Motivation. Ausgehend von differenzierten Be- 
funden kann davon ausgegangen werden, dass interindividuelle Unterschiede in in- 
traindividuellen Veränderungen der intrinsischen Motivation auch in den höheren 
Altersstufen auftreten. Das bedeutet, dass sich die intrinsische Motivation nicht bei 
allen Schülerinnen und Schülern gleichermaßen entwickelt. Bislang ist noch nicht 
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ausreichend geklärt, welche Merkmale der Schülerinnen und Schüler und des Un- 
terrichts diese Unterschiede in der Motivationsveränderung erklären können. Der 
Forschungsstand gibt Hinweise darauf, dass das Geschlecht und der Leistungsstand 
in Form der Deutschnote relevante Prädiktoren interindividueller Unterschiede in 
der Motivationsveränderung darstellen. Der Fokus bisheriger Studien liegt nach wie 
vor auf der Untersuchung der Motivationsveränderung in der Primar- oder Mittel- 
stufe im Mathematikunterricht. Der spezifische Beitrag der vorliegenden Arbeit 
liegt in der Analyse interindividueller Unterschiede in intraindividuellen Verände- 
rungen der intrinsischen Motivation bei Schülerinnen und Schülern im Deutschun- 
terricht im Laufe der Sekundarstufe II. 


3.4 Forschungsüberblick zum Zusammenhang zwischen 
Feedback und Motivation 


3.4.1 Die Bedeutung von Feedback für die Entwicklung der 
Lernmotivation 


Der in Abschnitt 3.3 berichtete Forschungsstand gibt Hinweise darauf, dass es in- 
terindividuelle Unterschiede in der Veränderung der intrinsischen Motivation gibt 
(u.a. Weidinger et al., 2015). Bei einigen Schülerinnen und Schülern ist die beobach- 
tete Abnahme der intrinsischen Motivation somit stärker ausgeprägt als bei anderen, 
während bei einzelnen Schülerinnen und Schülern die Abnahme nicht auftritt. Auf- 
grund der Bedeutung der intrinsischen Motivation für das Lernen und die Leistung 
erscheint es notwendig, Merkmale des Unterrichts zu identifizieren, die diese inter- 
individuellen Unterschiede in der Veränderung der intrinsischen Motivation erklä- 
ren. Auf der Basis der SDT kann angenommen werden, dass die Entwicklung der 
intrinsischen oder selbstbestimmten Motivation damit zusammenhängt, inwieweit 
die Lernumwelt die Wahrnehmung der Grundbedürfnisse nach Autonomie, Kom- 
petenz und sozialer Eingebundenheit unterstützt (Ryan & Deci, 2002; Schiefele, 
2014). Vor diesem Hintergrund kann die Motivationsabnahme im Laufe der Schul- 
zeit damit begründet werden, dass das mit steigendem Alter wachsende Bedürfnis 
nach Selbstbestimmung nicht zu der restriktiven Lernumwelt der Schule passt, in 
der extrinsische Anreize (z.B. Noten) eine größere Rolle einnehmen und der lehr- 
kraftzentrierte Unterricht wenig Raum für die Entfaltung der Selbstbestimmung 
bietet (Schiefele & Schaffner, 2020). In Übereinstimmung mit diesen Annahmen 
demonstrieren Gnambs und Hanfstingl (2016) in einer längsschnittlichen Studie mit 
Schülerinnen und Schülern zwischen 11 und 16 Jahren, dass die Abnahme im mo- 
tivationsrelevanten Erleben der Grundbedürfnisse nach Autonomie, Kompetenz 
und sozialer Bezogenheit mit der Abnahme der intrinsischen Motivation im Laufe 
der Schulzeit zusammenhängt. Demzufolge kann theoretisch davon ausgegangen 
werden, dass sich Merkmale der Lernumgebung positiv auf die Entwicklung der 
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intrinsischen Motivation auswirken und dass dieser Zusammenhang über die indi- 
viduelle Wahrnehmung der Grundbedürfnisse vermittelt wird. 

Motivationsförderliche Wirkungen von Feedback können mit der Cognitive Eva- 
nation Theory (CET; Deci et al., 1999) erklärt werden. Die CET ist eine Subtheorie 
der Selbstbestimmungstheorie über die Determinanten der intrinsischen Motiva- 
tion. Nach der CET wird die intrinsische Motivation durch das Erleben von Kom- 
petenz gefördert. Die Theorie postuliert weiterhin, dass die intrinsische Motivation 
durch Bedingungen der Lernumwelt beeinflusst werden kann. Besonders förderlich 
wirkt sich ein informierendes Feedback auf die Motivation aus, da es durch die In- 
formation über die individuellen Leistungen der Lernenden das grundlegende Be- 
dürfnis nach Kompetenz unterstützt (Deci & Ryan, 2000; Deci et al., 1999, 2001; 
Ryan & Deci, 2000). Das Feedback sollte dabei informierend gestaltet sein, indem 
es aufzeigt, wie nahe Lernende dem Lernziel sind und wie sie eine Aufgabe effekti- 
ver erledigen können (Klieme et al., 2010; Lipowsky, 2020; Rakoczy et al., 2013; 
Ryan & Deci, 2002). „Kontrollierendes Feedback hingegen betont, wie sich Ler- 
nende (hätten) verhalten sollen“ (Klieme et al., 2010, S. 66). Es führt häufig zu mehr 
Überwachung und Wettbewerb, was als Bedrohung des Bedürfnisses nach Autono- 
mie wahrgenommen werden und die intrinsische Motivation beeinträchtigen kann 
(Hattie & Clarke, 2019; Klieme ct al., 2010). 

Übereinstimmend zeigen empirische Studien, dass informierendes Feedback in 
Bezug auf den Leistungsstand die intrinsische Motivation erhöht und dass dieser 
Effekt über das wahrgenommene Kompetenzerleben vermittelt wird (Gniewosz et 
al., 2014; Vallerand & Reid, 1984). Im Gegensatz dazu führt negatives Feedback, 
das dem Lernenden eine geringe Kompetenz rückmeldet, zu einer Abnahme der 
intrinsischen Motivation (Deci & Ryan, 2000; Weidinger et al., 2016). Das positive 
Feedback wird dabei häufig über eine gute Note und negatives Feedback über eine 
schlechte Note operationalisiert (Weidinger et al., 2015, 2016). Einschränkend ist 
festzuhalten, dass Noten als Leistungsrückmeldung den Lernenden nur wenig In- 
formationen zum Lernfortschritt in Verbindung mit einem angestrebten Lernziel 
aufzeigt und auch keine Hinweise für die erfolgreiche und eigenständige Aufgaben- 
bearbeitung liefert (Rakoczy et al., 2013). So konnte Weidinger et al. (2015) geringe 
direkte und keine über das wahrgenommene Kompetenzempfinden vermittelten 
Effekte von Noten (als Form der Leistungsrückmeldung) auf die Veränderung der 
intrinsischen Motivation bei Grundschülerinnen und -schülern im Deutschunter- 
richt nachweisen. Die Autorinnen schlussfolgern, dass Noten nur eine untergeord- 
nete Rolle in der Erklärung von differenziellen Entwicklungen der intrinsischen 
Lernmotivation in der Grundschule spielen und dass andere Formen von Feedback 
für die Veränderung der intrinsischen Lernmotivation eine höhere Relevanz ein- 
nehmen (vgl. auch Ryan & Deci, 2020). Empirische Befunde weisen dahingehend 
nach, dass sich prozess-orientiertes Feedback — vermittelt über das Kompetenzer- 
leben — positiv auf die Entwicklung der intrinsischen Motivation auswirkt (Hond- 
rich et al., 2018; Kiemer et al., 2015; Levesque et al., 2004; Pat-El et al., 2012; Ra- 
koczy et al., 2013; Rakoczy, Klieme, Bürgermeister & Harks, 2008). So berichten 
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Hondrich et al. (2018) im Detail u.a. über direkte Effekte auf die intrinsische Moti- 
vation und das Kompetenzerleben von einem prozessorientierten Feedback, wel- 
ches Schülerinnen und Schüler im naturwissenschaftlichen Grundschulunterricht 
erhalten. Außerdem mediiert das Kompetenzerleben die Wirkung von Feedback 
auf die intrinsische Motivation. Auch in der Studie von Rakoczy ct al. (2013) wird 
der Effekt von prozessorientiertem Feedback auf das Interesse der Schülerinnen 
und Schüler im Mathematikunterricht der Sekundarstufe I über die wahrgenom- 
mene Kompetenzunterstützung vermittelt. Einzig in der Studie von Pat-El et al. 
(2012) wird das Feedback aus der subjektiven Sicht von Schülerinnen und Schülern 
erfasst, um diese Mediationseffekte empirisch nachzuweisen. Vergleichbare Studien 
für den Deutschunterricht oder die Sekundarstufe II liegen allerdings bisher nicht 
vot. 

Vor dem Hintergrund dieser empirischen Forschungsbefunde untersucht die 
vorliegende Arbeit den Effekt von „informativen“ Dimensionen von Feedback auf 
die Entwicklung der intrinsischen Lernmotivation, sowie abgeleitet von der Selbst- 
bestimmungstheorie die mediierende Wirkung des Kompetenzerlebens. 


3.4.2 Reziproke Effekte von Feedback und Lernmotivation 


Mit Blick auf die Forschung zum Zusammenhang zwischen Feedback und Motiva- 
tion zeigt sich, dass die Zusammenhänge häufig eindirektional untersucht werden, 
wobei Feedback typischerweise als ein Prädiktor der Motivationsentwicklung mo- 
delliert wird. Aus theoretischer und praktischer Perspektive sollten vielmehr wech- 
selseitige Einflüsse der beiden Konstrukte in Betracht gezogen werden: So kann 
davon ausgegangen werden, dass nicht nur Feedback auf die Motivationsentwick- 
lung der Schülerinnen und Schüler wirkt. Ebenso ist denkbar, dass auch die Schü- 
lerinnen und Schüler einer Klasse mit ihrer individuellen Motivation (u.a.) die Ge- 
staltung von Feedback und dessen Wahrnehmungs- sowie Verarbeitungsprozesse 
beeinflussen (Willems & Dreiling, 2022). Auf dieser Basis kann angenommen wer- 
den, dass durch die individuellen Lernvoraussetzungen (wie die Motivation) von 
Lernenden sogenannte „Mikro-Lernumwelten“ (Jurik et al., 2015, S. 696) entstehen 
(vgl. auch Seidel et al. 2016), die dazu führen, dass Schülerinnen und Schüler inner- 
halb einer Klasse den gleichen Unterricht (und das Feedback) unterschiedlich wahr- 
nehmen. Vermittelt über die unterschiedliche Nutzung des Unterrichtsangebots 
(z.B. Kompetenzerleben) ergeben sich differenzielle Wirkungen auf die Lernent- 
wicklungen. Diese Annahme wird auch theoretisch gestützt: In Angebots-Nut- 
zungs-Modellen der pädagogisch-psychologischen Unterrichtsforschung wird her- 
vorgehoben, dass Unterricht kein eindirektionales Geschehen ist, sondern wechsel- 
seitige Interaktionen zwischen Unterricht und Lernenden beinhaltet (Lipowsky, 
2020). Dieses reziproke Verhältnis wird in verschiedenen Angebots-Nutzungs-Mo- 
dellen (Kleickmann et al., 2019; Lipwosky, 2020; Reusser & Pauli, 2010; Seidel, 
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2014; Vieluf et al., 2020) durch beidseitige Pfeile zwischen dem Feld ,,Unterrichts- 
angebot“ und dem Feld „Wahrnehmung und Nutzung“ des Unterrichtsangebots 
durch die Lernenden abgebildet (vgl. Abbildung 5 in Abschnitt 2.5.1). 

Entsprechend verweisen aktuelle empirische Studien darauf, dass die Qualität 
von Unterrichtsmerkmalen wie Feedback nicht nur ein bedeutsamer Prädiktor der 
Motivation von Schülerinnen und Schülern ist. Die Wahrnehmung der Unterrichts- 
und Feedbackqualität wird ihrerseits durch die Eingangsmotivation und andere in- 
dividuelle Lernvoraussetzungen der Schülerinnen und Schüler beeinflusst (Igler et 
al., 2019; Jurik et al., 2015; Ruelmann et al., 2021; Schenke et al., 2018; Willems, 
2022a; Willems & Dreiling, 2022). Dabei wurde insbesondere herausgestellt, dass 
die Qualität von Unterrichtsmerkmalen wie Feedback umso positiver eingeschätzt 
wird, je höher motivationale Merkmale (z.B. intrinsische Motivation, Fachinteresse, 
Selbstkonzept) ausgeprägt sind. Dies könnte ein Hinweis auf interindividuelle Un- 
terschiede in den Unterrichtswahrnehmungen sein oder aber auch auf eine an die 
Bedürfnisse und Lernvoraussetzungen der Schülerinnen und Schüler angepasste 
Unterrichtsgestaltung der Lehrkraft zurückzuführen sein (Willems & Dreiling, 
2022). Jedoch gibt es bislang nur wenige Studien, die diese reziproken Zusammen- 
hänge zwischen Unterrichtswahrnehmungen und der Motivation von Schülerinnen 
und Schülern simultan betrachten. Insbesondere fehlt es an Studien, die auf der 
Individualebene untersuchen, inwiefern Veränderungen der subjektiven Unter- 
richtswahrnehmung von Schülerinnen und Schülern mit der Veränderung ihrer in- 
dividuellen Motivation zusammenhängen (Ruzek & Schenke, 2019). Eine solche 
Betrachtung von intraindividuellen Veränderungen erfordert längsschnittliche Da- 
ten zur individuellen Unterrichtswahrnehmung und Motivation von einzelnen 
Schülerinnen und Schülern (Ruzek & Schenke, 2019). 

Die Studie von Lazarides et al. (2019) widmet sich dieser Fragestellung in einer 
längsschnittlichen Studie, in der Schülerinnen und Schüler zu Beginn der fünften 
Klasse und nach einem Schuljahr im Mathematikunterricht zur wahrgenommenen 
Unterstützung der Lehrkraft und ihrem Interesse am Fach Mathematik befragt wur- 
den. Im Rahmen eines Larent-Change-Modells können die Autoren lediglich einen 
eindirektionalen Effekt von der wahrgenommenen Unterstützung zu Beginn der 
fünften Klasse auf die Stärke der Veränderung des Interesses im Laufe des Schul- 
jahres nachweisen. Demnach führt eine hohe Ausprägung der Unterstützung zu 
einer geringeren Abnahme des Interesses. Entgegen ihren Annahmen können sie 
keinen signifikanten Effekt vom Eingangsinteresse zu Beginn der Sekundarstufe I 
auf die Stärke der Veränderung der wahrgenommenen Unterstützung aufzeigen. 
Anders als erwartet lassen sich in der Studie auch keine korrelativen Zusammen- 
hänge zwischen Veränderungen des Interesses und Veränderungen der wahrge- 
nommenen Unterstützung bestätigen. 

Maulana et al. (2016) untersuchen ebenfalls Zusammenhänge zwischen Verän- 
derungen von Merkmalen der Unterrichtsqualität (wahrgenommene Klarheit, das 
Klassenmanagement und die Steuerung durch die Mathematik- und Englischlehr- 
kräfte) und der Motivation der Schülerinnen und Schüler (Selbstwirksamkeit und 
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intrinsischer Wert). Anders als Lazarides et al. (2019) bestätigen Maulana et al. 
(2016) die Annahme, dass Veränderungen der Motivation der Schülerinnen und 
Schüler mit Veränderungen der wahrgenommenen Unterrichtsqualitat zusammen- 
hängen und dass eine Abnahme der wahrgenommenen Unterrichtsqualitat mit einer 
Abnahme der Motivation einhergeht. Auch Ruzek & Schenke (2019) untersuchen 
in einer längsschnittlich angelegten Studie mit drei Messzeitpunkten über ein Schul- 
jahr verteilt, inwiefern die schülerindividuelle Unterrichtswahrnehmung (u.a. Auto- 
nomieunterstützung) mit der selbsteingeschätzten Motivation (u.a. Leistungsmoti- 
vation) zusammenhängt. Die Stichprobe setzt sich aus 961 Schülerinnen und Schü- 
lern zusammen, die in unterschiedlichen Fächern (u.a. Mathematik, Englisch) in den 
Klassenstufen 6 bis 12 an US-amerikanischen Schulen unterrichtet werden. Auf der 
Basis einer komplexen Strukturgleichungsanalyse (Random Intercept-Cross Lagged Panel 
Model) können sie keine Belege dafür finden, dass Veränderungen in den individu- 
ellen Unterrichtswahrnehmungen mit Veränderungen in den individuellen motiva- 
tionalen Merkmalen zusammenhängen. 

Zusammenfassend gibt es bislang nur wenige Studien, die sich mit den komplexen 
Interaktionen zwischen der wahrgenommenen Unterrichtsgestaltung (z.B. Feed- 
back) und der Motivation von Lernenden beschäftigen, obschon auf Basis von the- 
oretischen Angebots-Nutzungs-Modellen angenommen werden kann, dass nicht 
nur (die aus Schülersicht erfassten) Merkmale der Lernumgebung die (motivationa- 
len) Zielkriterien des Unterrichts beeinflussen, sondern auch Schülerinnen und 
Schüler in Abhängigkeit ihrer individuellen (motivationalen) Lernvoraussetzungen 
ihre Lernumgebung individuell wahrnehmen und nutzen. Mit Blick auf den bishe- 
rigen Forschungsstand zeigt sich, dass die Befunde zum Zusammenspiel dieser 
Merkmale bislang fragmentiert sind und weitere Forschung zu unterschiedlichen 
Komponenten der Unterrichtsqualität mit einem längsschnittlichen Studiendesign 
notwendig ist, um Veränderungen der Konstrukte erfassen zu können. 


4 Zusammenfassung und Rahmenmodell 


Das übergreifende Ziel dieser Arbeit ist es, die Wahrnehmung von Feedback aus 
der Sicht von Schülerinnen und Schülern im Deutschunterricht der gymnasialen 
Oberstufe zu analysieren sowie Zusammenhänge zwischen verschiedenen Dimen- 
sionen von wahrgenommener Feedbackqualität und der intrinsischen Lernmotiva- 
tion — als Lernvoraussetzung der Schülerinnen und Schüler einerseits und Zielkti- 
terium des Unterrichts andererseits — zu untersuchen. Vor diesem Hintergrund wer- 
den an dieser Stelle die theoretischen Ausführungen aus Kapitel 2 und 3 kurz zu- 
sammengefasst und das Rahmenmodell, das den eigenen empirischen Analysen zu- 
grunde liegt, vorgestellt. 

In den vorangegangenen Kapiteln konnte verdeutlicht werden, dass leistungs- 
bezogenes Feedback, welches Schülerinnen und Schüler im Unterricht von ihrer 
Lehrkraft erhalten, ein wichtiges Merkmal eines guten Unterrichts (Hattie, 2009; 
Lipowsky, 2020) und eines qualitätsvollen Unterrichtsgesprächs darstellt (Denn, 
2021; Pauli, 2006, 2010; Pauli & Reusser, 2018; Pehmer et al., 2015). Konzeptuell 
werden dabei mit dem Begriff (Lehrer-)Feedback „jede Art von Rückmeldung ver- 
standen, die sich auf die Leistung oder das Verständnis des Lernenden bezieht, die- 
sen über die Richtigkeit seiner Antwort bzw. seiner Aufgabenlösung informiert [...] 
oder ihm inhaltliche und/ oder strategische Hilfen und Informationen zu seinem 
Bearbeitungsprozess zur Verfügung stellt“ (Lipowsky, 2020, S. 83). In Bezug auf 
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die inhaltliche Gestaltung von Feedback im schulischen Unterricht wurden anhand 
der Feedback-Klassifizierung von Narciss (2006) zunächst die Unterscheidung zwi- 
schen einer einfachen und elaborierten Komponente von Feedback getroffen. Zu- 
sätzlich konnte anhand der Ausführungen von Hattie und Timperley (2007) deut- 
lich werden, dass Feedback ein mehrdimensionales Konstrukt darstellt und die 
Qualität von Feedback anhand der Ausprägung unterschiedlicher Dimensionen be- 
schrieben werden kann: Als lernförderlich gilt Feedback, wenn es nicht nur über 
den aktuellen Leistungsstand oder die richtige Antwort informiert (ergebnisorientierte 
Dimension), sondern auch Informationen zur Verbesserung des Lernprozesses oder 
der Antwort liefert (prozessorientierte Dimension) und die Lernenden zur eigenständi- 
gen Kontrolle des Lernprozesses oder der Antwort anregt (selbstregulationsorientierte 
Dimension) (vgl. Hattie & Timperley, 2007; Lipowsky, 2020; Willems & Dreiling, 
2022). In der Forschung zu Feedback im Unterrichtsgesprach (Denn, 2021; Pauli, 
2006, 2010; Pauli & Reusser, 2018; Pehmer et al., 2015) wird auBerdem argumen- 
tiert, dass ein qualitatsvolles Feedback nicht nur Informationen von der Lehrkraft 
enthalt, sondern auch zur Kontrolle und Bewertung des Beitrags durch den Ler- 
nenden selbst oder die gesamte Klasse anregt (dialogorientierte Dimension; vgl. Willems 
& Dreiling, 2022). 

Die dargestellte empirische Befundlage in Kapitel 2.3 verdeutlicht die Bedeu- 
tung von elaborierten Dimensionen von Feedback für die Leistungs- (Hattie, 2009; 
Harks et al., 2014; Kluger & DeNisi, 1996; Narciss & Huth, 2006; Wisniewski et al., 
2020) und Motivationsentwicklung von Lernenden (Jurik et al., 2014; Kiemer et al., 
2015; Rakoczy et al., 2013; Rakoczy et al., 2019; Rakoczy, Klieme, Bürgermeister & 
Harks, 2008). Mit Blick auf den gegenwärtigen Forschungsstand zur Ausprägung 
von Feedback im Unterricht zeigte sich in den dargestellten Videostudien, dass die 
Erteilung von ergebnisorientiertem Feedback die häufigste Form der Rückmeldung 
darstellt (vgl. z.B. Denn et al., 2015; Kobarg & Seidel, 2007; Lotz, 2016; Pohlmann- 
Rother et al., 2020). Dagegen wurden elaborierte Dimensionen von Feedback sehr 
viel seltener im Unterricht vergeben. Vor dem Hintergrund der in Abschnitt 2.5.1 
skizzierten theoretischen Modelle zur Wirksamkeit von Feedback (Lipnevich et al., 
2016; Strijbos & Müller, 2014) und Unterricht (Helmke, 2015; Seidel, 2014; Vieluf 
et al., 2020) sowie der dargestellten Forschungslage in Abschnitt 2.5.2 (u.a. Brooks 
et al., 2019; Hoya, 2019; Willems & Dreiling, 2022) kommt es nicht nur darauf an, 
wie das Feedback der Lehrkraft aus „objektiver“ Sicht gestaltet ist und wie sich 
dieses „objektiv“ gestaltete Feedback auf das Lernverhalten der Schülerinnen und 
Schüler auswirkt, sondern auch, wie es von den Lernenden als Adressatinnen und 
Adressaten des Feedbacks subjektiv wahrgenommen und interpretiert wird. Aktuell 
liegen mehrere Befunde zur Wahrnehmung von Feedback aus der Sicht von Schü- 
lerinnen und Schülern vor. Allerdings unterscheiden sich die Studien in der Opera- 
tionalisierung der Feedbackwahrnehmung. Die meisten Studien erfassen, wie Ler- 
nende auf Feedback im Allgemeinen reagieren und operationalisieren unterschied- 
liche Merkmale der Akzeptanz und Nützlichkeit von Feedback (Brooks et al., 2019; 
Lipnevich et al., 2021; Rakoczy et al., 2013; Strijbos et al., 2021). In dieser Arbeit 
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wird theoretisch argumentiert, dass Schülerinnen und Schüler zunächst die Auspra- 
gung von Feedback wahrnehmen müssen, bevor sie die Nützlichkeit und Akzeptanz 
bewerten und das Feedback für ihre eigenen Lernhandlungen nutzen. Mit Blick auf 
den empirischen Stand der Forschung wurde bislang mit wenigen Ausnahmen (vgl. 
z.B. Dreiling et al., 2018; Hoya, 2019; Sortker, 2019; Willems & Dreiling, 2022) 
kaum untersucht, wie Schülerinnen und Schüler die Ausprägung von Feedback der 
Lehrkraft im Unterricht retrospektiv einschätzen und inwiefern unterschiedliche 
Dimensionen der Feedbackqualität aus der Sicht von Schülerinnen und Schülern 
beschrieben werden können. Auf der Basis von Befunden der pädagogisch-psycho- 
logischen Unterrichtsforschung kann davon ausgegangen werden, dass Schülerein- 
schätzungen zur Unterrichtsqualität dazu genutzt werden können, um das Unter- 
richtsgeschehen differenziert zu beschreiben und die Trennung von unterschiedli- 
chen Dimensionen der Unterrichtsqualität empirisch nachweisen zu können (Göll- 
ner et al., 2016). Außerdem stehen Schüleraussagen zur Unterrichtswahrnehmung 
nachweislich im Zusammenhang mit kognitiven und motivational-affektiven Ziel- 
kriterien des Unterrichts (vgl. z.B. Fauth et al., 2014; Stahns et al., 2020). 

Anhand der in Abschnitt 2.5.3 beschriebenen Befunde zu interindividuellen Un- 
terschieden in der Unterrichts- und Feedbackwahrnehmung im Fach Deutsch (vgl. 
z.B. Jurik et al., 2015; Hoya, 2021; Stang & McElvany, 2020; Willems & Dreiling, 
2022) wurde deutlich, dass das von der Lehrkraft erteilte Feedback dutch die indi- 
viduellen Merkmale und Lernvoraussetzungen unterschiedlich (und anders als viel- 
leicht von der Lehrkraft ursprünglich intendiert) wahrgenommen und interpretiert 
werden kann, sodass Lernende von ein und demselben Feedback unterschiedlich 
profitieren können. Somit kommt auch der Untersuchung der differenziellen Wahr- 
nehmung von Feedback aus der Sicht von Schülerinnen und Schülern eine hohe 
Relevanz zu, um differenzielle Wirkungen von Feedback als Lernangebot besser zu 
verstehen. 

Die Ergebnisse der in Abschnitt 2.5.5 dargestellten längsschnittlichen Untersu- 
chungen verdeutlichen zudem, dass sich das Lehrkraftverhalten in Bezug auf unter- 
schiedliche Unterrichtsmerkmale aus der Sicht von Schülerinnen und Schülern im 
Laufe der Schulzeit verändern kann. Obwohl Befunde in Bezug auf die Verände- 
rung der Feedbackwahrnehmung fehlen, können die Ergebnisse zu langsschnittli- 
chen Entwicklungen von ähnlichen Konstrukten (z.B. Unterstützung) ein Hinweis 
darauf sein, dass eine Untersuchung der Veränderung des Feedbackverhaltens aus 
der Sicht der Schülerinnen und Schüler inhaltlich aufschlussreich sein kann (De Wit 
et al., 2010; Lazarides, Fauth et al., 2021; Way et al., 2007). Eine Veränderung der 
Qualität des Unterrichts — im Speziellen des Feedbacks - ist auch in der Sekundar- 
stufe II anzunehmen, da sich durch die Leistungsdifferenzierung in den Kursen 
auch Herausforderungen hinsichtlich der Anpassung des unterrichtlichen Handelns 
der Lehrkraft ergeben (vgl. Abschnitt 2.5.4). Neben der Analyse der intraindividu- 
ellen Veränderung der Feedbackwahrnehmung scheint es auch bedeutsam, das Ge- 
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schlecht und das Leistungsniveau als Prädiktoren von interindividuellen Unterschie- 
den in der Veränderung der Wahrnehmung einzubeziehen (De Wit et al., 2010; 
Maulana ct al., 2016). 

Im Hinblick auf die Zielsetzung der Arbeit, die prädiktive Bedeutsamkeit der 
wahrgenommenen Feedbackqualität für die Motivationsentwicklung zu untersu- 
chen, wurde im Rahmen des Kapitels 3 der Zusammenhang zwischen (wahrgenom- 
menem) Feedback und der Motivation von Schülerinnen und Schülern in den Blick 
genommen. Als motivationstheoretische Grundlage dient dabei die SDT (Ryan & 
Deci, 2002, 2017). Die dargestellten Befunde nationaler und internationaler Studien 
zeigen, dass die durchschnittliche Lernmotivation von Schülerinnen und Schülern 
im Laufe der Schulzeit sinkt (Corpus et al., 2009; Gnambs & Hanfstingl, 2015; Gott- 
fried et al., 2001; McElvany et al., 2008; Lazarides et al., 2019; Otis et al., 2005; 
Spinath & Steinmayr, 2005). Dartiber hinaus konnten interindividuelle Unterschiede 
in der Motivationsveränderung über die Zeit nachgewiesen werden, die demonst- 
rieren, dass die Entwicklung nicht bei allen Schiilerinnen und Schtlern gleicherma- 
Ben auftritt (Gottfried et al., 2007; Gottfried et al., 2017; Spinath & Steinmayr, 2008; 
Weidinger et al., 2015). Auf der Basis der SDT kann angenommen werden, dass 
diese Veränderung der Motivation im Laufe der Schulzeit damit zusammenhängt, 
inwieweit der Unterricht die Wahrnehmung der Grundbedürfnisse nach Autono- 
mie, Kompetenz und sozialer Eingebundenheit bei Schülerinnen und Schülern un- 
terstützt (Ryan & Deci, 2002). Die positive Wirkung von leistungsbezogenem Feed- 
back lässt sich dabei dadurch erklären, dass insbesondere das Kompetenzerleben 
und vermittelt darüber die intrinsische Lernmotivation gefördert wird (Deci & 
Ryan, 2000; Deci et al., 1999, 2001; Ryan & Deci, 2000). Die diesbezüglich vorge- 
stellten empirischen Untersuchungen bestätigen diese Mediationseffekte (vgl. z.B. 
Hondrich et al., 2018; Kiemer et al., 2015; Pat-El et al., 2012; Rakoczy et al., 2013). 
Mit Blick auf den Forschungsstand wird jedoch deutlich, dass in den dargestellten 
Studien häufig die motivationalen Effekte eines von außen beobachteten Feedbacks 
im Rahmen von Videostudien oder in quasi-experimentellen Designs im Fokus 
steht. Demgegenüber liegen zum gegenwärtigen Zeitpunkt kaum Studien vor, in 
denen die direkten und indirekten Zusammenhänge zwischen unterschiedlichen, 
aus Schülersicht wahrgenommenen Dimensionen der Feedbackqualität und der 
Entwicklung der Motivation im Deutschunterricht (der Sekundarstufe II) unter- 
sucht werden. Da bislang auch selten wechselseitige Einflüsse von Unterrichtswahr- 
nehmungen und motivationalen Merkmalen simultan modelliert wurden (u.a. La- 
zatides et al., 2019; Maulana et al., 2016; Ruzek & Schenke, 2019), erweitert die 
Studie die Analysen zu den Zusammenhängen der Veränderungen der beiden Kon- 
strukte sowie zu den £reuzverzögerten Effekten eines Konstrukts zu Beginn des Schul- 
jahres auf die zeitlich nachfolgende Veränderung des anderen Konstrukts im Ver- 
lauf des Schulhalbjahres. 

Als Analysegrundlage der Arbeit dient ein Angebots-Nutzungs-Modell (vgl. Ab- 
bildung 7), in dem das Feedback der Lehrkraft als ein Angebot verstanden wird, das 
von den Schülerinnen und Schülern in Abhängigkeit ihrer individuellen Merkmale 
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differenziell wahrgenommen und genutzt wird. Analog zu Modellen der Feedback- 
forschung (Lipnevich et al., 2016; Lipnevich & Panadero, 2021; Strijbos et al., 2014) 
und der pädagogisch-psychologischen Unterrichtsforschung (Seidel, 2014; Vieluf et 
al., 2021) impliziert das Angebots-Nutzungs-Modell, dass der Lernerfolg neben der 
Qualität der Feedbackgestaltung im Wesentlichen auch von der Wahrnehmung und 
der Nutzung des Feedbacks abhängt. Die (motivationalen) Wirkungen resultieren 
aus der Interaktion von Feedback als Angebot und der Wahrnehmung sowie Nut- 
zung durch die Schülerinnen und Schüler. Daher steht auch in dieser Arbeit die 
individuelle Wahrnehmung von Feedback aus der Sicht von Schülerinnen und Schülern 
im Vordergrund, wobei ein Ziel der Arbeit darin besteht, die individuelle Wahrneh- 
mung differenziert über theoretisch postulierte Dimensionen der Feedbackqualität 
(Ergebnis, Prozess, Selbstregulation, Dialog) zu erfassen. 


Wahrnehmung von 
Feedback als Nutzung Wirkung 
Lernangebot 


Nützlichkeit 
von Feedback 


Intrinsische 
Lernmotivation 
Selbstregulations- 
orientierung 


Erleben von 
Kompetenz 


Individuelle Merkmale von Schüler*innen 


o Individuelle Leistung, Geschlecht, Eingangsmotivation 


Abbildung 7: Theoretisches Rabmenmodell der Forschungsarbeit (eigene Darstellung) 


Weil Feedback von Schülerinnen und Schülern in Abhängigkeit ihrer individuellen 
Merkmale in unterschiedlicher Weise wahrgenommen werden kann und sich dem- 
entsprechend auch differenzielle Wirkungen ergeben können (Hoya, 2021; Ruel- 
mann et al, 2021; Sortker, 2019; Willems & Dreiling, 2022), werden die 
Deutschnote sowie das Geschlecht der Schülerinnen und Schüler als relevante indi- 
viduelle Merkmale in die Analysen einbezogen. Aus dem Zusammenspiel von Feed- 
back als Angebot und den Merkmalen der Schülerinnen und Schüler können diffe- 
renzielle Nutzungen und Wirkungen resultieren (Vieluf et al., 2020). In Anlehnung 
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an aktuelle Angebots-Nutzungs-Modelle (vgl. z.B. Kleickmann et al., 2019; Lip- 
owsky, 2020; Vieluf et al., 2020) wird nicht nur die unidirektionale Wirkung der 
wahrgenommenen Feedbackqualität auf die intrinsische Motivation — als Zielkrite- 
rium von Unterricht — berücksichtigt, sondern auch deren komplexe Interaktion. In 
diesem Sinne wird die intrinsische Lernmotivation auch als relevante individnelle 
Lernvoranssetzung betrachtet, die Einfluss auf die Wahrnehmung der Feedbackquali- 
tät nehmen kann. Zudem werden auch indirekte Zusammenhänge zwischen der 
wahrgenommenen Feedbackqualität und der Motivation betrachtet, indem die in- 
dividuellen Nutzungs- und Verarbeitungsprozesse von Schülerinnen und Schülern 
modelliert werden. Als Indikatoren der individnellen Nutzung von Feedback können 
— in Anlehnung an die theoretischen Modelle — sowohl kognitive Komponenten 
(operationalisiert über die Wahrnehmung der Nützlichkeit von Feedback, vgl. Lip- 
nevich et al., 2016; Strijbos et al., 2021) als auch motivationale Komponenten (ope- 
rationalisiert über das subjektive Kompetenzerleben, vgl. Klieme & Rakoczy, 2008; 
Rakoczy et al., 2013) betrachtet und methodisch als Mediatorvariablen in den Ana- 
lysen zur Wirkung von Feedback auf die intrinsische Lernmotivation berücksichtigt 
werden. 

Im nachfolgenden Kapitel werden die einzelnen Forschungsfragen und Hypo- 
thesen der empirischen Untersuchung konkretisiert und im theoretischen Rahmen- 
modell verortet. 


5 Forschungsfragen und Hypothesen 


Die vorliegende Arbeit knüpft an die umfangreichen Forschungsarbeiten an, die die 
Qualität und Wirksamkeit von Feedback im schulischen Unterricht untersuchen. 
Aufgrund der nachgewiesenen Bedeutsamkeit von Feedback für die Lernentwick- 
lung von Schülerinnen und Schülern erscheint es notwendig, die Bedingungen zu 
untersuchen, unter denen Feedback seine förderlichen Wirkungen entfaltet. Vor 
dem Hintergrund der differenziellen Effekte von Feedback richtet die Forschung 
zunehmend ihren Blick auf die Wahrnehmung sowie auf die individuellen Merkmale 
von Schülerinnen und Schülern, die die Wirksamkeit von Feedback beeinflussen. 
Dabei ist zu berücksichtigen, dass es bisher an empirischen Untersuchungen man- 
gelt, die systematisch untersuchen, wie Schülerinnen und Schüler die Ausprägung 
von Feedback der Lehrkraft im Unterricht retrospektiv einschätzen und inwiefern 
diese Einschätzung prädiktiv für die Motivationsentwicklung von Schülerinnen und 
Schülern ist. Diese Arbeit greift diese Forschungslücke auf. Anknüpfend an die em- 
pirischen Vorarbeiten von Dreiling et al. (2018) und Willems & Dreiling (2022) wird 
ein Modell der Feedbackqualität aus der Sicht von Schülerinnen und Schülern im 
Deutschunterricht der Oberstufe untersucht. Es soll geprüft werden, ob sich die 
Struktur des Modells für unterschiedliche Gruppen von Schülerinnen und Schülern 
(z.B. Geschlechtergruppen) und zu mehreren Zeitpunkten (z.B. im Laufe eines 
Schuljahres) in gleicher Weise abbilden lässt. Da bislang kaum Längsschnittstudien 
zur Veränderung von Wahrnehmungen von Unterrichtsqualitätsmerkmalen in der 
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gymnasialen Oberstufe vorliegen, wird unter Anwendung von Latent-True-Change- 
Modellen die (differenzielle) Veränderung der Feedbackwahrnehmung von Ober- 
stufenschülerinnen und -schülern in Deutschkursen im Verlauf eines Schulhalbjah- 
res untersucht. 

Aus den Darstellungen des theoretischen und empirischen Forschungsstandes 
leiten sich konkret drei übergeordnete Forschungsfragen für die vorliegende Arbeit 
ab: 


Hauptforschungsfrage I: Wie nehmen Schülerinnen und Schüler das Feed- 
back der Lehrkraft im Deutschunterricht der gym- 
nasialen Oberstufe zu Beginn und zur Mitte eines 


Schulhalbjahres wahr? 

Hauptforschungsfrage I: In welchem Zusammenhang steht die wahrgenom- 
mene Feedbackqualitat mit der intrinsischen Lern- 
motivation? 

Hauptforschungsfrage II: Wird der Zusammenhang zwischen der wahrge- 


nommenen Feedbackqualität und der Veränderung 
der intrinsischen Lernmotivation durch die wahr- 
genommene Nützlichkeit von Feedback und das 
Kompetenzerleben mediiert? 


Die übergeordnete Forschungsfrage 1 bezieht sich dabei auf die differenzielle 
Wahrnehmung und Veränderung von Feedback als Unterrichtsmerkmal, während 
die Forschungsfragen 2 und 3 die direkten und indirekten Wirkungen von Feedback 
auf die intrinsische Lernmotivation als Zielkriterium des Unterrichts fokussieren. 
Abbildung 8 verankert die drei Hauptforschungsfragen in dem oben vorgestellten 
theoretischen Rahmenmodell. 

Die aus jeder übergeordneten Forschungsfrage resultierenden Teilfragestellun- 
gen werden in den folgenden Abschnitten dargestellt. Dabei werden auch unter Be- 
zugnahme auf den theoretischen und empirischen Hintergrund (Kapitel 2 und 3) 
die dazugehörigen Forschungshypothesen abgeleitet. Diese beziehen sich — wie 
dem theoretischen Teil der Arbeit zu entnehmen ist — auf vier verschiedene Dimen- 
sionen der wahrgenommenen Qualität von Feedback: Ergebnis-, Prozess-, Selbst- 
regulations- und Dialogorientierung. 
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o Individuelle Leistung, Geschlecht, Eingangsmotivation 


Abbildung 8: Verankerung der Forschungsfragen im theoretischen Rahmenmodell (eigene Darstellung) 


5.1 Differenzielle Wahrnehmung von Feedback 


Neben der Gestaltung von Feedback beeinflussen auch die individuelle Wahrneh- 
mung und Nutzung von Feedback durch die Schülerinnen und Schüler dessen Wir- 
kungen auf leistungsbezogene und motivationale Zielkriterien. Aus modelltheoreti- 
scher Sicht ist das Konstrukt der Feedbackqualität mehrdimensional konzipiert. 
Erste empirische Studien weisen dahingehend nach, dass die wahrgenommene 
Feedbackqualität anhand von vier Faktoren (Ergebnis-, Prozess-, Selbstregulations- 
und Dialogorientierung) differenziert abgebildet werden kann (Dreiling et al., 2018; 
Willems & Dreiling, 2022). 


Faktorielle Struktur und Dimensionalität der wahrgenommenen Feedbackqualität 


Aufbauend auf den modelltheoretischen Annahmen und ersten empirischen Unter- 
suchungen soll im ersten Schritt die Dimensionalität und faktorielle Struktur der 
wahrgenommenen Feedbackqualität systematisch untersucht werden. Dabei soll 
aus methodischer Sicht geklärt werden, welches Verfahren (Generalfaktormodell, 
Modell mit korrelierten Faktoren, Faktormodell höherer Ordnung) zur Modellie- 
rung der Dimensionalität der wahrgenommenen Feedbackqualität geeignet ist. Da- 
her lautet die erste Teilfragestellung: 
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Fla: Inwieweit kann die faktorielle Struktur und Dimensionalität der 
Wahrnehmung der Feedbackqualität im Rahmen unterschiedlicher 
latenter Faktormodelle beschrieben werden? 


Messinvarianz im Längsschnitt und im Multigruppenvergleich 


Um Veränderungsprozesse zu untersuchen und differenzielle Wahrnehmungen 
zwischen Schülerinnen und Schülern unterschiedlichen Geschlechts herausstellen 
zu können, müssen in einem zweiten Schritt Aquivalenzannahmen überprüft und 
die Voraussetzungen für die Vergleichbarkeit des Feedbackkonstrukts über die ver- 
schiedenen Messzeitpunkte sowie über die Geschlechtergruppen geschaffen wer- 
den. Die nächsten zwei Teilfragestellungen adressieren demnach die Messinvarianz 
der Feedbackwahrnehmung: 


Fib: Inwieweit kann für das eingesetzte Instrument zur Erfassung der 
Wahrnehmung von Feedback starke faktorielle Messinvarianz über 
die verschiedenen Messzeitpunkte bestätigt werden? 


Fle: Inwieweit kann fiir das eingesetzte Instrument zur Erfassung der 
Wahrnehmung von Feedback starke faktorielle zwischen den Ge- 
schlechtergruppen bestatigt werden? 


Veränderung der Peedbackwahrnehmung 


In einem zweiten Schritt wird die Veränderbarkeit der Feedbackwahrnehmung über 
die Zeit in den Blick genommen. Dabei ist die folgende Fragestellung leitend: 


Pld: Inwieweit lassen sich eine Veränderung der Wahrnehmung von 
Feedback und interindividuelle Unterschiede in der Veränderung 
der Feedbackwahrnehmung im Laufe eines Schulhalbjahres be- 
schreiben? 


Bislang existieren nicht viele Studien zur Veränderung in der Qualität der Unter- 
richtswahrnehmung aus der Sicht von Schülerinnen und Schülern, da zum einen 
Schülereinschätzungen zur Unterrichtsqualität als stabil gelten (Göllner et al., 2016), 
zum anderen, da eine solche Untersuchung Daten zur Unterrichtswahrnehmung 
von Schülerinnen und Schülern zu mehreren Messzeitpunkten erfordert (Ruzek & 
Schenke, 2019). In Anbetracht der bisherigen Forschungsergebnisse, die Rückgänge 
der wahrgenommenen Qualität von Unterrichtsmerkmalen (insbesondere Unter- 
stützung) im Laufe der Schulzeit nachweisen (Sekundarstufe I: Lazarides et al., 2019; 
Reddy et al., 2003; Oberstufe: De Wit et al., 2010), wird auch in der vorliegenden 
Studie erwartet, dass die wahrgenommene Feedbackqualitat über das Schnlhalbjahr hinweg 
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sinkt (H1d-1) und dass sich interindividuelle Unterschiede in der Veränderung der Feedback- 
wahrnehmung zeigen (Hld-2). 


Pradiktoren differenzieller Wahrnehmungen 


Theoretische Modelle und empirische Befunde geben Hinweise darauf, dass Ler- 
nende innerhalb gleicher Klassen das Feedback der Lehrkraft in unterschiedlicher 
Weise wahrnehmen und interpretieren. Daher werden in einem dritten Schritt auf 
Prädiktoren der differenziellen Wahrnehmung und Veränderung von Feedback fo- 
kussiert: 


Fle: Inwiefern beeinflusst das Geschlecht von Schülerinnen und Schü- 
lern interindividuelle Unterschiede im Ausgangsniveau und in der 
Veränderung der Wahrnehmung von Feedbackqualität? 


In einigen Studien erwies sich das Geschlecht als signifikanter Prädiktor der Feed- 
backwahrnehmung im (Deutsch-) Unterricht (Carvalho et al., 2014; Havnes et al., 
2012; Hoya, 2021; Lipnevich & Lopera-Oquendo, 2022; Sortker, 2018, 2019). Au- 
Berdem zeigt sich, dass Mädchen die Qualität des Deutschunterrichts insgesamt po- 
sitiver einschätzen als Jungen (Jurik et al., 2015; Wagner, 2008). Gleichzeitig entste- 
hen auch Wahrnehmungsunterschiede in Abhängigkeit der Leistung (Hoya, 2021; 
Jurik et al., 2015; Wagner, 2008). Daher wird auch für die vorliegende Studie ange- 
nommen, dass das Geschlecht — auch unter Berücksichtigung der V orleistung — einen relevanten 
Pradiktor differenzieller Feedbackwabrnehmungen darstellt (H1e-1). 

Der Einfluss des Geschlechts auf interindividuelle Unterschiede in der Verande- 
rung der Unterrichtswahrnehmung wurde hingegen seltener untersucht. Zudem er- 
wiesen sich die Befunde als inkonsistent. Die Forschungsergebnisse von De Wit et 
al. (2010) und Maulana et al. (2016) liefern Hinweise für differenzielle Veränderun- 
gen in den Unterrichtswahrnehmungen (z.B. Unterstützung durch die Lehrkraft) in 
Abhängigkeit des Geschlechts. Entgegengesetzte Befunde berichten Reddy et al. 
(2003) sowie Way et al. (2007): Geschlechtsspezifische Unterschiede konnten im 
Ausgangsniveau, nicht aber in der Veränderung der Unterrichtswahrnehmung 
nachgewiesen werden. Allerdings liegen zum gegenwärtigen Zeitpunkt keine Stu- 
dien vor, in denen interindividuelle Unterschiede in der Veränderung der Feedback- 
wahrnehmung untersucht werden. Außerdem bezieht sich lediglich die Studie von 
De Wit et al. (2010) auf die Oberstufe. Mit Blick auf die vorliegende Arbeit wird 
daher unter Bezugnahme auf theoretische Gesichtspunkte angenommen, dass das 
Geschlecht der Schülerinnen und Schüler — auch unter Berücksichtigung der V orleistung — einen 
relevanten Pradiktor interindividneller Unterschiede in der Veränderung der Feedbackwahrneh- 
mung darstellt (H1e-2). 
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5.2 Zusammenhang zwischen Feedback und 
Lernmotivation 


Auf Basis der SDT kann angenommen werden, dass Unterschiede in der Entwick- 
lung der Lernmotivation dadurch auftreten können, dass Lernumgebungen das Er- 
leben von Autonomie, Kompetenz und sozialer Eingebundenheit in unterschiedli- 
chem Maße unterstützen. Eine Veränderung der Lernumgebung (z.B. eine Ab- 
nahme oder Zunahme des Feedbacks der Lehrkraft) würde der Theorie zufolge 
auch zu einer Veränderung der selbstbestimmten Motivation führen. Gleichzeitig 
ist vor dem Hintergrund aktueller Angebots-Nutzungs-Modelle, in denen die Un- 
terrichtswirkung als Resultat der Interaktion von Unterrichtsangebot und Schüler- 
merkmalen beschrieben wird (Lipowsky, 2020; Reusser & Pauli, 2010; Vieluf et al., 
2020), davon auszugehen, dass zum einen die Qualität von Feedback als Lernange- 
bot die Motivation von Schülerinnen und Schülern beeinflusst. Zum anderen kann 
die Ausprägung motivationaler Merkmale als individuelle Lernvoraussetzung Un- 
terschiede in der Wahrnehmung und Wirksamkeit von Feedback hervorrufen (Jurik 
et al., 2015; Ruelmann et al., 2021; Willems & Dreiling, 2022). Dies kann dazu füh- 
ren, dass die Wahrnehmung und Wirkung von Feedback zwischen Schülerinnen 
und Schülern mit unterschiedlichen Ausprägungen in der Motivation variieren kön- 
nen. Die vorliegende Studie erlaubt es, das Zusammenspiel von Feedback und der 
Schülermotivation im Rahmen eines längsschnittlichen Strukturgleichungsmodells 
zu untersuchen und damit zentrale Annahmen von Angebots-Nutzungs-Modellen 
zu testen. 


Zusammenhänge zwischen der Feedbackwahrnehmung und der Lernmotivation 


Zunächst wird untersucht, ob sich eine Abnahme in der intrinsischen Lernmotiva- 
tion im Laufe des Schulhalbjahres beobachten lässt und ob sich positive Zusam- 
menhänge zwischen den intraindividuellen Veränderungen von Feedbackwahrneh- 
mung und intrinsischer Lernmotivation zeigen. Daher lautet die Teilfragestellung: 


F2a: In welchem Zusammenhang stehen die wahrgenommene Feed- 
backqualität und die intrinsische Lernmotivation sowie die Verän- 
derungen der beiden Konstrukte im Schulhalbjahr? 


Bislang gibt es nur wenige Längsschnittstudien, die die Wirkrichtungen von Unter- 
richtswahrnehmungen und Motivation simultan in einem Modell untersuchen, wo- 
bei die gefundenen Ergebnisse ein fragmentiertes Bild liefern (Lazarides et al., 2019; 
Maulana et al., 2016; Ruzek & Schenke, 2019). Studien, die unidirektionale Wirkun- 
gen von Feedback und Motivation untersuchen, belegen zum einen positive Effekte 
von (wahrgenommenem) Feedback auf die Entwicklung der intrinsischen Motiva- 
tion (Hondrich et al, 2018; Kiemer et al., 2015; Levesque et al., 2004; Pat-El et al., 
2012; Rakoczy et al., 2013; Rakoczy, Klieme, Bürgermeister & Harks, 2008). Zum 
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anderen finden sich einzelne Hinweise dafür, dass auch die individuelle Motivation 
von Schülerinnen und Schülern ihre Wahrnehmung von Feedback beeinflusst 
(Ruelmann et al., 2021; Willems & Dreiling, 2022). Vor diesem Hintergrund wird 
auch für die vorliegende Untersuchung angenommen, dass die wahrgenommene Feed- 
backqualitat zu Beginn des Schuljahres die Veränderung in der intrinsischen Lernmotivation im 
Laufe des Schulhalbjahres vorhersagt (H2b-1) und dass auch die intrinsische Lernmotivation zu 
Beginn des Schuljahres die Veränderung in der Wahrnehmung von Feedbackqualitat im Laufe 
des Schuljahres vorhersagt (H2b-2). 


5.3 Indirekte Wirkungen von Feedback auf die 
Lernmotivation 


Während die vorher genannten Fragestellungen analysieren, inwieweit die Wahr- 
nehmung von Feedback mit der intrinsischen Lernmotivation in direkter Weise mit- 
einander zusammenhängen, fokussieren die nachfolgenden Teilfragestellungen auf 
die mediierende Funktion von Komponenten der individuellen Nutzung. Als Indika- 
toren der individuellen Nutzung von Feedback werden — in Anlehnung an theore- 
tische Modelle — die Wahrnehmung der Nützlichkeit sowie das Kompetenzerleben 
betrachtet und methodisch als Mediatorvariablen in den Analysen zur Wirkung von 
Feedback auf die intrinsische Lernmotivation berücksichtigt. Die Teilfragestellun- 
gen lauten wie folgt: 


F3a: Inwiefern wird der Zusammenhang zwischen der wahrgenomme- 
nen Feedbackqualität und der Veränderung der intrinsischen Lern- 
motivation durch die individuell wahrgenommene Nützlichkeit von 
Feedback mediiert? 


F3b: Inwiefern wird der Zusammenhang zwischen der wahrgenomme- 
nen Feedbackqualität und der Veränderung der intrinsischen Lern- 
motivation durch das Kompetenzerleben mediiert? 


Auf Basis theoretischer Modelle (vgl. Abschnitt 2.5.1) und empirischer Befunde 
(Harks et al., 2014; Rakoczy et al., 2013) wird erwartet, dass die wahrgenommene Nütz- 
lichkeit von Feedback die Wirkung von wahrgenommener Peedbackqualitat auf die Veränderung 
der intrinsischen Lernmotivation vermitteln und erklären kann (H3a). Außerdem wird vor 
dem Hintergrund einzelner Forschungsbefunde (Gniewosz et al., 2014; Hondrich 
et al., 2018; Rakoczy et al., 2013; Vallerand & Reid, 1984) angenommen, dass das 
Kompetenzerleben die Wirkung von wahrgenommener Feedbackqualität auf die Veränderung der 
intrinsischen Lernmotivation vermitteln und erklären kann (H3b). 


6 Methodisches Vorgehen 


Für die empirische Prüfung der Fragestellungen werden Daten aus dem Projekt 
„Feedback im Kontext von Heterogenität“ (FeeHe) verwendet. Im Folgenden wer- 
den Hintergründe und Forschungsdesign des FeeHe-Projekts (Abschnitt 6.1) sowie 
die Stichprobe (Abschnitt 6.2), die auch dieser Forschungsarbeit zugrunde liegt, nä- 
her beschrieben. Nach der Beschreibung der verwendeten Erhebungsinstrumente 
(Abschnitt 6.3) werden die zentralen methodischen Anforderungen an die Auswer- 
tung der Daten diskutiert. Hierzu zählen der Umgang mit der hierarchischen Da- 
tenstruktur (Abschnitt 6.4) und die Behandlung fehlender Werte (Abschnitt 6.5). In 
Abschnitt 6.6 werden die statistischen Analyseverfahren zur Beantwortung der For- 
schungsfragen erläutert. 


6.1 Die Messwiederholungsstudie FeeHe 


Das Projekt FeeHe untersucht, inwieweit die Wahrnehmung und Wirkung von 
Feedback im Deutschunterricht der gymnasialen Oberstufe im Zusammenhang mit 
individuellen Lernvoraussetzungen der Schülerinnen und Schüler steht (Willems et 
al., 2020). Darüber hinaus stehen auch Fragen der differenziellen Wahrnehmung 
und Wirkung von Basisdimensionen der Unterrichtqualität (Klassenführung, Schü- 
lerorientierung und kognitives Aktivierungspotenzial) im Deutschunterricht der 
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gymnasialen Oberstufe im Vordergrund von FeeHe. Das Projekt ordnet sich damit 
in bisherige Forschungsarbeiten der empirischen Schul- und Unterrichtsforschung 
ein, die zum einen die lernförderliche Wirkung von Feedback als Unterrichtsmerk- 
mal zeigen und zum anderen die individuelle Wahrnehmung und Perspektive der 
Schülerinnen und Schüler in Bezug auf die Feedback- und Unterrichtsqualität in 
den Mittelpunkt rücken. Das Projekt wurde am Lehrstuhl für Empirische Bildungs- 
forschung mit dem Schwerpunkt Schul- und Unterrichtsforschung des Instituts für 
Erziehungswissenschaft an der Georg-August-Universitat Göttingen unter der Lei- 
tung von Prof. Dr. Ariane S. Willems durchgeführt. 

FeeHe ist als Messwiederholungsstudie mit zwei Erhebungszeitpunkten — Be- 
ginn und Mitte eines Schuljahres — konzipiert. Die Eingangserhebung (MZP 1) fand 
zum Schuljahresbeginn 2017/18 und die Folgeerhebung (MZP 2) zur Mitte des 
Schuljahres 2017/18 statt. Die an der Studie beteiligten Schulen wurden auf der 
Grundlage einer für das Schuljahr 2017/2018 vollständigen Liste von allgemeinbil- 
denden Schulen mit einer gymnasialen Oberstufe im Raum Südniedersachsen zu- 
fällig ausgewählt. Für jede gezogene Schule (Erstschule) wurde eine zufällige Er- 
satzschule gezogen, die erst nach Absage einer Erstschule kontaktiert wurde. Die 
sich zur Teilnahme bereit erklärten Schulen entschieden selbst, welche Deutsch- 
kurse an der Befragung teilnehmen sollten. Zur Durchführung der Studie wurden 
vorab die Genehmigung der Niedersächsischen Landesschulbehörde sowie (bei 
minderjährigen Schülerinnen und Schülern) eine schriftliche Einverständniserklä- 
rung der Eltern eingeholt. 

Zum ersten und zweiten Messzeitpunkt wurden die teilnehmenden Schülerin- 
nen und Schüler zu ihrer Wahrnehmung von Feedback und zu ihrer Einschätzung 
der Basisdimensionen der Unterrichtsqualität sowie des motivationsunterstützen- 
den Verhaltens (Erleben von Autonomie, Kompetenz und sozialer Eingebunden- 
heit) befragt. Darüber hinaus wurden bei der Eingangsbefragung unterschiedliche 
Hintergrundvariablen (z.B. soziale Herkunft, Geschlecht, Sprachgebrauch) sowie 
motivationale und (meta-)kognitive Lerneingangsvoraussetzungen (z.B. intrinsische 
und extrinsische Lernmotivation, Zielorientierung, Fachinteresse, Selbstkonzept, 
Lernstrategien, Noten) der Schülerinnen und Schüler erhoben (Willems et al., 2020). 
Die motivationalen und (meta-)kognitiven Merkmale wurden auch zum zweiten 
Messzeitpunkt erhoben, um spätere Veränderungsmessungen durchführen zu kön- 
nen. Eine Übersicht über die einzelnen Messzeitpunkte und die erhobenen Kon- 
strukte ist in Abbildung 9 dargestellt. 
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2. Schulhalbjahr 2017 Beginn des Schuljahres Mitte des Schuljahres 
2017/2018 2017/ 2018 
Č 
Pilotierung Eingangserhebung (MZP1) Folgeerhebung (MZP2) 
des Schülerfragebogens 


| | 


Individuelle Eingangsvoraussetzungen Individuelle Merkmale 


S (z.B. Fachinteresse, Lernstrategien, (z.B. Fachinteresse, Lernstrategien, 
2 Noten) Noten) 

= Schülereinschätzung der Feedback- Schülereinschätzung der Feedback- 
5 und Unterrichtsqualitat sowie des und Unterrichtsqualitat sowie des 
2 motivationsunterstützenden motivationsunterstützenden 

a Verhaltens der Lehrkraft Verhaltens der Lehrkraft 


Hintergrundvariablen (u.a. sozialer 
Hintergrund, Geschlecht) 


Abbildung 9: Übersicht über die Datenerhebung im FeeHe-Projekt (Willems et al, 2020, $. 10) 


6.2 Beschreibung der Stichprobe 


Im Folgenden wird die Gesamtstichprobe der FeeHe-Studie im Deutschunterricht 
der gymnasialen Oberstufe beschrieben. 

An der Eingangsbefragung zum Schuljahresbeginn 2017/2018 (erster Messzeit- 
punkt, tı) nahmen 807 Schülerinnen und Schüler aus 49 Deutschkursen der gymna- 
sialen Oberstufe von 9 Schulen im Raum Siidniedersachsen teil. Die Folgeerhebung 
(zweiter Messzeitpunkt, t2) wurde zur Mitte des Schuljahres mit 696 Schülerinnen 
und Schülern in 43 Deutschkursen (9 Schulen) durchgeführt. 

Das durchschnittliche Alter lag zu tı bei 16.60 Jahren (SD = .84) und zu tz bei 
17.17 (SD = .90). Etwa die Hälfte der Teilnehmenden war weiblich (tı: 53.2%, tz: 
55.2%). Der Migrationshintererund wurde über die Schülerangaben zum Sprachge- 
brauch zu Hause und zum Geburtsland der Eltern erfasst. In der Stichprobe der 
Oberstufenschülerinnen und -schüler gaben die meisten (81.1%) an, dass sie immer 
Deutsch zu Hause sprechen, 13.8 % sprechen meistens Deutsch, 4.7% sprechen meis- 
tens eine andere Sprache und nur manchmal Deutsch und nur 0.4% sprechen nie Deutsch 
zu Hause. Bei etwa einem Viertel (20.4%) der befragten Schülerinnen und Schüler 
ist mindestens ein Elternteil nicht in Deutschland geboren. 

Als Indikatoren des sozialen Hintergrunds warden der Bildungshintergrund der El- 
tern und die Anzahl der Bücher im Haushalt erfasst. Bei 68.3% der Schülerinnen 
und Schüler weist mindestens ein Elternteil das Abitur als höchsten Schulabschluss 
auf. Die meisten Schülerinnen und Schüler (34.4%) berichteten, dass sie über 200 
Bücher besitzen, weniger Schülerinnen und Schüler (27.9%) gaben an, dass sie zwi- 
schen 26 und 100 Bücher besitzen. Zwischen 101 und 200 Bücher besitzen 26.2% 
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der Schülerinnen und Schüler. Die Anzahl der Schülerinnen und Schüler, die be- 
richteten zwischen 11 und 25 Bücher zu besitzen lag bei 8.6% und zwischen 0 bis 
10 Bücher bei lediglich 2.9%. 

Zum ersten Erhebungszeitpunkt befanden sich 60.3% (te: 47.8%) der Teilneh- 
menden in der Jahrgangsstufe 11 und 39.7 % (te: 52.2%) in der Jahrgangsstufe 12. 
Die mittlere Kursgröße betrug zum ersten und zweiten Messzeitpunkt 16 Schüle- 
rinnen und Schüler (SD, = 3.31; SDz = 3.67). Ein Anteil von 54.1 % (tz: 52.2%) 
der Schülerinnen und Schüler besuchte zum ersten Messzeitpunkt einen Kurs mit 
einem erhöhten Anspruchsniveau und 45.9% (te: 45.0%) einen Kurs mit einem 
grundlegenden Anspruchsniveau. Die deskriptiven Kennwerte der Stichprobe über 
beide Messzeitpunkte sind im Überblick in Tabelle 2 dargestellt. 


Tabelle 2: Deskriptive Kennwerte zur Beschreibung der Stichproben zu beiden 
Messzeitpunkten 


MZP 1 MZP 2 
(Beginn des Schuljahres) (Mitte des Schuljahres) 
Anzahl Schiiler*innen 807 696 
Anzahl Schüler*innen nach 
Schulform 
Gymnasium 755 662 
Gesamtschule 52 34 


Jahrgangsstufe (in %) 
11 


487 (60.3%) 


333 (47.8%) 


12 320 (39.7%) 363 (52.2%) 
Anzahl Deutschkurse 49 43 
Kursgröße MW = 16 (SD = 3.46) MW = 16 (SD = 3.67) 


Kursniveau (in %) 


gA 367 (45.9%) 312 (45.0%) 

eA 433 (54.1%) 382 (55.0%) 
Geschlecht (in %) 

Weiblich 429 (53.2%) 384 (55.2%) 
Männlich 378 (46.8%) 312 (44.8%) 
Alter MW = 16.70 (SD = .84) MW = 17.17 (SD = .90) 


Anmerkungen. w = weiblich, m = männlich; gA = grundlegendes Anforderungsniveau, eA = 
erhöhtes Anforderungsniveau. 
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6.3 Erhebungsinstrumente 


Im Folgenden werden die eingesetzten Erhebungsinstrumente zur Erfassung der in 
der vorliegenden Arbeit relevanten Konstrukte beschrieben. Insgesamt wurden viet 
Konstrukte, die im Rahmen des FeeHe-Projekts im Schülerfragebogen erfasst wur- 
den, verwendet: (1) die Qualität von Feedback (Abschnitt 6.3.1), (2) die wahrge- 
nommene Nützlichkeit von Feedback (Abschnitt 6.3.2), (3) das wahrgenommene 
Kompetenzerleben (Abschnitt 6.3.3) und (4) die intrinsische Lernmotivation (Ab- 
schnitt 6.3.4). Zusätzlich wurden die Vorleistung und das Geschlecht der Schüle- 
rinnen und Schüler als Hintergrundvariablen in die Analysen einbezogen (Abschnitt 
6.3.5). 


6.3.1 Qualität von Feedback 


Die Qualitat von Feedback wurde zu Beginn des Schuljahres (MZP 1) und zur Mitte 
des Schuljahres (MZP 2) aus der Sicht von Schülerinnen und Schülern erhoben. Die 
Schülerinnen und Schüler wurden gebeten einzuschätzen, inwiefern die Aussagen 
zum Feedback, das ihnen die Deutschlehrkraft nach einem Beitrag im Unterrichts- 
gespräch mündlich erteilt, auf sie zutreffen. 

Zur differenzierten Erfassung der wahrgenommenen Qualität von Feedback 
wurden insgesamt 16 Items eingesetzt (vgl. Tabelle 3), die theoretisch vier Dimen- 
sionen der Feedbackqualität erfassen: (1) ergebnisorientierte Dimension (Items 1- 
4), (2) prozessorientierte Dimension (Items 5-8), (3) selbstregulationsorientierte Di- 
mension (Items 9-12) und (4) dialogorientierte Dimension (Items 13-16). Die Ska- 
len 1-3 bilden die von Hattie & Timperley (2007) theoretisch angenommenen Di- 
mensionen von Feedback im Unterricht ab, während die vierte Skala eine speziell 
für das öffentliche Unterrichtsgespräch relevante Dimension beschreibt (vgl. Pauli, 
2006). Das Instrument zur Feedbackqualität wurde im Rahmen des Projekts 
FeeDO (Feedback im Deutschunterricht der gymnasialen Oberstufe) entwickelt und in zwei 
Teilstudien mit Oberstufenschülerinnen und -schülern in Deutschkursen empirisch 
überprüft (Dreiling et al., 2018). Die 4-Faktor-Struktur der Feedbackqualität ließ 
sich dabei empirisch abbilden. Im Rahmen der FeeHe-Studie wurde das Instrument 
weiterentwickelt (Willems et al., 2020) und empirisch validiert (Willems & Dreiling, 
2022). In Tabelle 3 sind die Items zur wahrgenommenen Feedbackqualität mit den 
deskriptiven Kennwerten aufgeführt. 
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Tabelle 3: Items zur Erfassung der Feedbackqualität mit deskriptiven Kennwerten 


Nr. Itemwortlaut 
MWt/MWr SDh/SDt 


Die Deutschlehrkraft ... 

1 macht durch ihre Rückmeldung deutlich, was sie 2.94/2.84 0.78/0.73 
von mir erwartet. 
macht durch ihre Ruckmeldung deutlich, was das 

E Ziel der Aufgabenbearbeitung ist. AL RO 

3 mac ht durch ihre Rüc kmeldung deutlich, ob ich auf 3.36/3.22 0.71/0.66 
dem richtigen Weg bin. 

4 macht durch ihre Rückmeldung deutlich, was noch 2.90/2.90 0.75/0.70 
fehlt, damit ich ihre Erwartungen erfülle. ; ` : : 

5 erklart mir eine Frage oder Aufgabenstellung noch- 2.92/2.97 0.82/0.80 
mals, wenn meine Antwort nicht stimmt. 

6 gibt mir konkrete Denkanstöße, die mir dabei hel- 2.97/3.02 0.79/0.78 


fen, auf die richtige Antwort zu kommen. 


verdeutlicht mir, was ich noch nicht verstanden 
7 habe, um mir zu helfen, auf die richtige Antwort zu 2.80/2.82 0.75/0.75 


kommen. 

8 stellt Riickfragen, die mir dabei helfen, meinen Bei- 3.08/3.11 0.73/0.73 
trag zu überdenken. 

9 lässt mir ausreichend Zeit, meine Antwort zu über- 2.88/2.88 0.75/0.77 


denken. 
10 gibt mir die Möglichkeit, mich selbst zu verbessern. 3.22/3.18 0.71/0.74 


regt mich dazu an, meine Antwort alleine kritisch zu 


11 a 2.62/2.75 0.77/0.79 
prüfen. 

12 hinterfragt meinen Beitrag kritisch, so dass ich mich 2.91/3.02 0.73/0.74 
selbst korrigieren kann. 

13 stellt meinen Beitrag zur Diskussion in den Kurs. 2.98/3.11 0.75/0.75 


regt den ganzen Kurs dazu an, mir Tipps zu geben, 
14 damit wir gemeinsam auf die richtige Antwort kom- 2.59/2.77 0.88/0.87 
men. 

animiert den ganzen Kurs dazu, meinen Beitrag zu 

15 bewerten (z.B. „Was meinen denn die anderen 3.16/3.16 0.77/0.80 
dazu"). 

greift meinen Beitrag auf und lässt den Kurs darüber 
sprechen. 


16 3.03/3.14 0.75/0.73 


Anmerkungen. Instruktion: „Im Folgenden möchten wir Sie bitten, einige Fragen zu Ihrem 
Deutschunterricht zu beantworten. Die Fragen beziehen sich auf mündliche Rückmeldun- 
gen, die Ihre Lehrkraft Ihnen gibt, wenn Sie im Unterricht auf Fragen antworten oder sich 
mit einem Beitrag am Klassengespräch beteiligen“; Antwortformat: 1 = trifft nicht zu, 2 = 
trifft eher nicht zu, 3 = trifft eher zu, 4 = trifft zu. 
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6.3.2 Wahrgenommene Nützlichkeit von Feedback 


Für die Erfassung der wahrgenommenen Nützlichkeit von Feedback aus Schüler- 
sicht wurde im Rahmen des FeeHe-Projekts eine neue Skala entwickelt, die sich an 
bereits bestehende Skalen anlehnt und aus dem Englischen adaptiert wurde (Steel- 
man et al., 2004; Strijbos et al., 2010; King et al., 2009; Rowe & Wood, 2008; vgl. 
hierzu ausführlich Willems et al., 2020). Die Skala umfasst insgesamt vier Items, die 
auf einer vierstufigen Antwortskala erhoben wurden. In Tabelle 4 sind die Items 
zur wahrgenommenen Nützlichkeit mit den deskriptiven Kennwerten aufgeführt. 
In den Analysen dieser Arbeit wurde die Einschätzung der Nützlichkeit von Feed- 
back zum zweiten Messzeitpunkt berücksichtigt. 


Tabelle 4: Items zur Erfassung der wahrgenommenen Nützlichkeit mit deskripti- 
ven Kennwerten 


Itemwortlaut 
Nr. MWt SDi 
Die Rückmeldungen ... 
1 sind wichtig für mich, um mich zu verbessern. 3.18 0.86 
2 spornen mich an. 2.70 0.93 
3 sind nützlich für mich. 3.02 0.88 
4 zeigen mir, wo meine Stärken und Schwächen liegen. 2.80 0.87 


Anmerkungen. Instruktion: „Im Folgenden möchten wir Sie bitten, einige Fragen zu Ihrem 
Deutschunterricht zu beantworten. Die Fragen beziehen sich auf mündliche Rückmeldun- 
gen, die Ihre Lehrkraft Ihnen gibt, wenn Sie im Unterricht auf Fragen antworten oder sich 
mit einem Beitrag am Klassengespräch beteiligen“; Antwortformat: 1 = trifft nicht zu, 2 = 
trifft eher nicht zu, 3 = trifft eher zu, 4 = trifft zu. 


6.3.3 Wahrgenommenes Kompetenzerleben 


In den Analysen wurde das aus Schülersicht wahrgenommene Kompetenzerleben 
zum Messzeitpunkt 2 berücksichtigt. Im Projekt FeeHe wurden vor dem Hinter- 
grund der Selbstbestimmungstheorie (Deci & Ryan, 2000; Ryan & Deci, 2002, 2017) 
Skalen zum motivationsrelevanten Erleben (von Kompetenz, Autonomie und so- 
zialer Eingebundenheit) weiterentwickelt, die sich an bereits bestehende Instru- 
mente anlehnen (Gagné, 2003; Ilardi et al., 1993; Willems, 2011; Williams & Deci, 
1996; vgl. hierzu ausführlich Willems et al., 2020). Die Skala zum wahrgenommenen 
Kompetenzerleben umfasst insgesamt sechs Items, die auf einer vierstufigen Ant- 
wortskala erhoben wurden. In Tabelle 5 sind die Items mit den deskriptiven Kenn- 
werten aufgeführt. 
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Tabelle 5: Items zur Erfassung des wahrgenommenen Kompetenzerlebens mit de- 
skriptiven Kennwerten 


Itemwortlaut 

Nr. M Wt SDt 
Im Deutschunterricht ... 

1 bin ich zufrieden mit meinen Leistungen. 2.66 0.90 

2 fühle ich mich den Anforderungen des Unterrichts ge- 3.07 0.71 
wachsen. 

3 kann ich auch schwierige Aufgaben gut lösen. 2.83 0.76 

4 finden meine Leistungen Anerkennung bei meinen Mit- 271 0.76 
schüler/innen. 

5 kann ich zeigen, was ich kann. 2.61 0.86 

6 vermittelt meine Lehrkraft mir den Eindruck, dass sie mit 2.80 0.82 


meinen Leistungen zufrieden ist. 


Anmerkungen. Instruktion: „Im Folgenden wollen wir mehr über Ihre Einstellung und Ihr 
Lernverhalten im Fach Deutsch erfahren“; Antwortformat: 1 = trifft nicht zu, 2 = trifft eher 
nicht zu, 3 = trifft eher zu, 4 = trifft zu. 


6.3.4  Intrinsische Lernmotivation 


Die intrinsische Lernmotivation wurde als individuelles Merkmal der Schülerinnen 
und Schüler zu Beginn des Schuljahres und nach einem halben Jahr erhoben. The- 
oretische Grundlage (vgl. Abschnitt 3.1 und 3.2) bildete die Selbstbestimmungsthe- 
orie (Deci & Ryan, 2000; Ryan & Deci, 2002, 2017). Für die vorliegende Studie 
wurden dazu Items aus etablierten Instrumenten für den Kontext des Deutschun- 
terrichts der Oberstufe adaptiert (Ryan & Connell 1989; Thomas & Müller 2011; 
vgl. hierzu ausführlich Willems et al., 2020). In Tabelle 6 sind die sechs Items der 
Subskala Intrinsische Lernmotivation mit ihren deskriptiven Kennwerten aufgeführt. 


Tabelle 6: Items zur Erfassung der intrinsischen Lernmotivation mit deskriptiven 
Kennwerten 


Itemwortlaut 
Nr. MWt/ MWt SDti/SDt2 
In der Regel lerne ich für Deutsch, ... 
1 weil es mir Spaß macht. 2.16/2.12 0.96/0.98 
2 weil ich mich gerne mit diesem Fach beschäftige. 2.24/2.18 0.98/0.96 
3 weil ich gerne neue Dinge in Deutsch dazulerne. 2.40/2.30 0.96/0.97 
4 weil ich mich für das Fach interessiere. 2.39/2.91 1.03/0.99 
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Itemwortlaut 
Nr. MWt/ MWt SDh/SDt 
In der Regel lerne ich für Deutsch, ... 
5 weil ich die Themen und Inhalte spannend finde. 2.40/2.25 0.94/0.92 
6 weil mir die Inhalte des Faches wichtig sind. 2.50/2.34 0.98/0.97 


Anmerkungen. Instruktion: „Im Folgenden wollen wir mehr über Ihre Einstellung und Ihr 
Lernverhalten im Fach Deutsch erfahren“; Antwortformat: 1 = trifft nicht zu, 2 = trifft eher 
nicht zu, 3 = trifft eher zu, 4 = trifft zu. 


6.3.5  Hintergrundvariablen 


In den Analysen wurden potenzielle Einflüsse des Geschlechts und der Vorleistung 
der Schülerinnen und Schüler auf die wahrgenommene Feedbackqualität und die 
intrinsische Motivation untersucht. 


Geschlecht 


Das Geschlecht der Schülerinnen und Schüler wurde über die Angaben der Lehr- 
kraft in der Schülerteilnahmeliste ermittelt und ging als dichotome Variable (0 = 
männlich, 1 = weiblich) in die Analysen ein. 


V orleistung 


Die Vorleistung wurde über die Deutschnote zu Beginn des Schuljahres erhoben. 
Hierzu machten die Deutschlehrkräfte Angaben über die letzte Zeugnisnote der 
Schülerinnen und Schüler in ihrem Kurs. Für Schülerinnen und Schüler, die zu Be- 
ginn des Schuljahres gerade in die Jahrgangsstufe 11 eingetreten sind, wurde die 
Note im letzten Zeugnis (Klasse 10) auf der herkömmlichen Notenskala von 1 (sehr 
gut) bis 6 (ungenügend) erfasst. Für Schülerinnen und Schüler in Jahrgangsstufe 12 
wurde die Deutschnote im letzten Zeugnis (Klasse 11) mit dem Punktesystem der 
Oberstufe erhoben (15 bis 13 Notenpunkte = sehr gut, 12 bis 10 Notenpunkte = 
gut, 9 bis 7 Notenpunkte = befriedigend, 6 bis 4 Notenpunkte = ausreichend, 3 bis 
1 Notenpunkte = mangelhaft, 0 Notenpunkte = ungenügend). 

Für die Analysen des FeeHe-Projekts wurden die Notenpunkte in Ziffernnoten 
umgewandelt (15 bis 13 Notenpunkte = Note 1, 12 bis 10 Notenpunkte = Note 2 
usw.). Mit der Note 1 wurden 9.7% der Schülerinnen und Schüler bewertet, 29.1% 
mit der Note 2, 40.5% mit der Note 3, 19.4% mit der Note 4 und 1.3% mit der 
Note 5. Im Rahmen der Analysen dieser Arbeit wurde zur einfacheren Interpreta- 
tion der Ergebnisse die Notenvariable umkodiert, sodass niedrige Werte eine be- 
friedigende bis ungenügende Leistung und hohe Werte eine gute bis schr gute Leis- 
tung abbilden. 
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6.4 Hierarchische Struktur der Daten 


Die Daten der FeeHe-Studie weisen eine Mehrebenenstruktur auf: Die 
Schülerinnen und Schüler dieser Stichprobe sind innerhalb von Klassen (und 
Schulen) geschachtelt. Im Vergleich zu einer einfachen Zufallsstichprobe sind die 
Ergebnisse dieser K/umpenstichprobe oder Ciusterstichprobe ungenauer, wenn die 
Schülerinnen und Schüler innerhalb einer Klasse (eines Clusters) sich ähnlicher sind 
als Schülerinnen und Schüler aus unterschiedlichen Klassen (Döring & Bortz, 
2016). Wird dieser sog. Designeffekt bei der Modellschätzung nicht berücksichtigt, 
kann dies zu einer Unterschätzung der Standardfehler und damit zu einer liberalen 
Signifkanztestung führen (Julian, 2001; Raudenbush & Bryk, 2002). 

Für die Analysen der Arbeit sind die Unterschiede in den 
Merkmalsausprägungen zwischen der Individual- und Klassenebene nicht explizit 
Teil der Hypothesen. Außerdem interessieren nicht die über verschiedene 
Schülerinnen und Schüler gemittelten Beurteilungen der Feedbackqualität 
(Klassenebene). Vielmehr sind die interindividuellen Unterschiede in den 
Wahrnehmungen der Feedbackqualität und deren Zusammenhänge mit den 
individuellen Ausprägungen und Entwicklungen der Motivation der einzelnen 
Schülerinnen und Schüler von Bedeutung. Im Vordergrund stehen also die 
individuellen Wahrnehmungen der Feedbackqualität, sodass die Individualebene 
die geeignete Analyseebene darstellt (Lüdtke et al., 2009). 

Eine Möglichkeit, die geclusterte Datenstruktur dennoch zu berücksichtigen, 
besteht in der Korrektur der Standardfehler. Bei dem in der vorliegenden Arbeit 
verwendeten Statistikprogramm Mplus wird die Mehrebenenstruktur mittels der 
Analyseoption Ape=complex und durch die Verwendung der Klassen-ID als 
Clustervariable bei der Berechnung der Standardfehler und der Modellanpassung 
berücksichtigt (Muthen & Satorra, 1995; Watermann & Baumert, 2006). 


6.5 Umgang mit fehlenden Werten 


Der angemessene Umgang mit fehlenden Werten in der FeeHe-Studie stellt eine 
besondere Herausforderung dar. In Längsschnittstudien ist man häufig mit dem 
Problem konfrontiert, dass Personen an einem oder an mehreren Messzeitpunkten 
nicht an der Erhebung teilnehmen (Lüdtke & Robitzsch, 2011), wodurch fehlende 
Daten für ganze Messzeitpunkte entstehen (unit nonresponse bzw. wave nonresponse, vel. 
Schafer & Graham, 2002; Spieß, 2010). In der FeeHe-Studie basieren die Daten 
zum ersten Messzeitpunkt auf N = 807 und zum zweiten Messzeitpunkte auf 
N = 696. Diese sog. unit nonresponse bzw. wave nonresponse ist auf unterschiedliche 
Gründe wie Krankheit oder Kurswechsel einzelner Schülerinnen und Schüler zu- 
rückzuführen. Außerdem konnten insgesamt sechs Deutschkurse aufgrund von 
Terminschwierigkeiten oder eines Lehrerwechsels nicht mehr an der Folgeerhebung 
teilnehmen. 
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Demgegenüber ist der Ausfall bei einzelnen Variablen, die durch die fehlende 
Beantwortung einiger Items entstanden sind (ifem nonresponse, vgl. Schafer & Gra- 
ham, 2002; Spieß, 2010), zu beiden Messzeitpunkten als gering einzustufen. Hier 
liegt der Anteil fehlender Werte für die in den Analysen einbezogenen Skalen auf 
Itemebene im Durchschnitt bei 0.6% (MZP 1) bzw. 0.8% (MZP 2), wobei der 
höchste Anteil fehlender Werte für ein Item bei 3.5% (MZP 1) bzw. 2.2% (MZP 2) 
liegt (vgl. Tabelle 7). Somit übersteigt keines der Items den als kritisch angesehenen 
Schwellenwert von 5% fehlender Werte (Lüdke et al., 2007). 

Mit fehlenden Werten sind unterschiedliche Probleme verbunden: Erstens füh- 
ren sie aufgrund der reduzierten Stichprobengröße zu einem Verlust an Effizienz 
bei der Parameterschätzung, zweitens ist der Umgang mit den Daten erschwert, weil 
die statistischen Verfahren üblicherweise vollständige Datenmatrizen erwarten und 
drittens besteht die Gefahr verzerrter Parameterschätzungen, weil sich Personen 
mit gültigen und Personen mit fehlenden Werten systematisch in den Variab- 
lenausprägungen unterscheiden (Lüdtke et al., 2007; Lüdtke & Robitzsch, 2011). 

Bevor darauf eingegangen wird, wie in der vorliegenden Arbeit fehlende Werte 
behandelt werden, sollen kurz die verschiedenen Entstehungsformen fehlender 
Werte im Datensatz erläutert werden (Lüdtke et al., 2007): Wenn fehlende Werte 
vollständig zufällig und unsystematisch entstehen, liegt Missing Completely at Random 
(MCAR) vor. Die Annahme von MCAR ist, dass das Fehlen von Werten auf einer 
Variable (z.B. Leistung) unabhängig von allen interessierenden Variablen ist — seien 
deren Werte beobachtet oder nicht. Dies ist beispielsweise der Fall, wenn das Fehlen 
von Werten im Leistungstest von Schülerinnen und Schülern weder mit anderen 
Variablen wie dem sozioökonomischen Status noch mit der Leistung selbst zusam- 
menhängt, d.h. Schülerinnen und Schüler mit und ohne fehlende Werte im Leis- 
tungstest unterscheiden sich weder systematisch in ihrem sozioökonomischen Sta- 
tus noch in ihrer Leistung. Eine weniger restriktive und damit schwächere Annahme 
als MCAR ist Missing at Random (MAR). Konkret meint dies, dass das Auftreten von 
fehlenden Werten im Leistungstest vollständig von beobachteten Variablen im Da- 
tensatz abhängt, nicht aber von Variablen, deren Werte fehlen. Beispielsweise kann 
es vorkommen, dass systematisch Schülerinnen und Schüler mit einem niedrigen 
sozioökonomischen Status einzelne Aufgaben im Leistungstest nicht lösen. Das 
Fehlen der Werte im Leistungstest hängt aber nicht systematisch von der Leistung 
selbst ab. Solche potenziellen Einflussvariablen können im Modell statistisch kon- 
trolliert werden, um korrekte Parameterschätzungen zu erhalten. Fehlen die Daten 
nicht zufällig, spricht man von Missing not at Random (MNAR). In diesem Fall hängt 
das Auftreten der fehlenden Werte auch nach Kontrolle von unterschiedlichen Hin- 
tergrundvariablen von der fehlenden Ausprägung in der Variable selbst ab. Fehlen 
beispielsweise auch nach Berücksichtigung des sozioökonomischen Status systema- 
tisch Werte von leistungsschwachen Schülerinnen und Schülern im Leistungstest, 
dann sind diese fehlenden Werte nicht zufällig entstanden und können somit nicht 
für korrekte Parameterschätzungen genutzt werden (Dietrich, 2019). 
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Mit fehlenden Werten im Datensatz kann je nach Entstehungsform der fehlen- 
den Werte und statistischer Analysemethode unterschiedlich umgegangen werden. 
Dabei wird zwischen klassischen Ansätzen (z.B. fallweiser Ausschluss) und moder- 
nen Ansätzen unterschieden. Letztere werden weiterhin unterteilt in a) imputations- 
basierte Verfahren (Multiple Imputation), in denen fehlende Werte dutch sinnvolle 
Schätzungen (sog. plausible values) ersetzt werden, sowie b) modellbasierte Verfahren 
(Full-Information-Maximum-Likelibood (FIML)), in denen die Modellschätzung und 
der Umgang mit fehlenden Werten simultan erfolgen (Enders, 2001; Lüdtke et al., 
2007; Schafer & Graham, 2002). Klassische Ausschlussverfahren gelten als proble- 
matisch, da der Ausschluss von Fällen aus dem Datensatz u.a. mit einer Verringe- 
rung der Teststärke und zu verzerrten Parameterschätzungen führen kann. In Si- 
mulationsstudien konnte die Überlegenheit des FIML-Ansatzes gegenüber dem 
Ausschluss von Daten nachgewiesen werden (Enders, 2001; Enders & Bandalos, 
2001). FIML ist eine modellbasierte Methode zum Umgang mit fehlenden Werten, 
die insbesondere für die (längsschnittliche) Strukturgleichungsmodellierung emp- 
fohlen wird (Lüdtke et al., 2007; Schafer & Graham, 2002). Der FIML-Algorithmus 
zeichnet sich dadurch aus, dass die Behandlung fehlender Werte und die Modell- 
schätzung in einem Schritt vorgenommen werden. Dabei erfolgt die Parameter- 
schätzung für die Fälle mit fehlenden Werten auf Basis der beobachteten Daten 
unter der Annahme von MAR und multivariater Normalverteilung (Lüdtke et al., 
2007). Aber auch bei nicht-normalverteilten Daten sind die FIML-Parameterschät- 
zungen weniger verzerrt und effizienter als die zum Vergleich herangezogenen Er- 
gebnisse anderer Techniken des listenweisen oder paarweisen Ausschlusses fehlen- 
der Werte (Enders, 2001). Gleichzeitig können die Standardfehler bei nicht normal- 
verteilten Daten verzerrt sein — hier bietet sich aber eine Korrektur über einen ro- 
busten Schätzer (i.d.R. MLR-Schätzer bei kontinuierlichen Variablen bzw. 
WLSMV-Schätzer bei kategorialen Variablen) an (Reinecke, 2014). In Strukturglei- 
chungsprogrammen wie Mplus ist das FIML-Verfahren inzwischen standardmäßig 
implementiert, sodass die Parameterschätzung von Modellen mit unvollständigen 
Daten unproblematisch ist. In der vorliegenden Arbeit wurde daher auch auf das 
FIML-Verfahren zur Behandlung der fehlenden Werte zurückgegriffen. Dieses 
wurde einer multiplen Imputation der Daten vorgezogen, da Maximum-Likelihood- 
Verfahren im Vergleich zur multiplen Imputation u.a. als effizienter und vorausset- 
zungsärmer gelten (Allison, 2012). 
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Tabelle 7: Anteil fehlender Werte auf Itemebene (Item-Nonresponse) 


Skala/Item MZP1 MZP2 
Skala: EO Feedback 

fbev3 0.5 0.6 
fbev4 0.1 0.3 
fbev6 0.2 0.9 
fbpol 0.5 0.3 
Skala: PO Feedback 

fbpo5 0.5 0.4 
fbpo6 0.6 0.9 
fbpo7 0.6 0.4 
fbpo9 0.9 0.4 
Skala: SO Feedback 

fbse4 0.9 0.4 
fbse6 0.7 1.1 
fbse8 0.6 0.6 
fbse9 0.4 0.9 
Skala: DO Feedback 

fbdil 0.9 0.4 
fbdi3 0.2 0.4 
fbdi4 0.4 0.6 
fbdi6 0.2 0.1 
Skala: Nützlichkeit 

fbnut1 0.7 0.7 
fbnut2 1.2 0.9 
fbnut3 1.1 1.0 
fbnut5 1.0 0.7 
Skala: Kompetenzerleben 

kompl 0.7 1.4 
komp2 0.9 1.0 
komp3 1.4 1.9 
komp4 3.5 2.2 
komp5 2.0 1.4 
komp6 1.6 1.9 
Skala: Intrinsische Lernmotivation 

intrin1 0.5 1.0 
intrin2 0.6 1.0 
intrin3 0.5 1.1 
intrin4 0.6 1.0 
intrin5 0.4 1.0 
intrin6 0.7 1.0 


Anmerkungen. EO = Ergebnisorientierte Dimension; PO = Prozessorientierte Dimension; 
SO = Selbstregulationsorientierte Dimension; DO = Dialogorientierte Dimension. 
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6.6 Statistische Analysemethoden 


Im folgenden Abschnitt erfolgt eine ausführliche Darstellung der in der vorliegen- 
den Arbeit durchgeführten Analysen. Sämtliche Analysen wurden mit der Software 
Mplus in der Version 8.4 (Muthen & Muthén, 1998-2019) durchgeführt. 


6.6.1 Konfirmatorische Faktorenanalyse 


Insgesamt wurden alle verwendeten latenten Variablen zunächst im Rahmen von 
konfirmatorischen Faktoranalysen (Confirmatory Factor Analysis, CFA; vgl. z.B. 
Brown, 2015) auf ihre Dimensionalität und faktorielle Validität überprüft. Die CFA 
ist — im Vergleich zur explorativen Faktorenanalyse — ein hypothesengeleitetes Ver- 
fahren, bei dem die Anzahl der Faktoren und die Zuordnung der Indikatorvariablen 
zu den Faktoren a priori festgelegt wird (Brown, 2015). Die Grundlage der CFA ist 
die Spezifikation von Messmodellen, in denen systematische Zusammenhänge zwi- 
schen den manifesten Indikatorvariablen durch latente — und damit messfehlerbe- 
reinigte — Faktoren erklärt werden (Faktoren 1. Ordnung; vgl. Geiser, 2011). Bei 
systematischen, hohen Korrelationen zwischen den Faktoren 1. Ordnung wird zu- 
sätzlich geprüft, inwiefern (a) ein Generalfaktormodell, in dem den gemessenen 
Merkmalen ein gemeinsamer Faktor zugrunde liegt (z.B. g-Faktor der Feedback- 
wahrnehmung), und (b) ein Faktormodell 2. Ordnung die Datenstruktur angemes- 
sen abbilden. Bei (b) wird davon ausgegangen, dass hinter den Faktoren noch ein 
übergeordneter gemeinsamer Faktor steht (Gäde, Schermelleh-Engel & Brandt, 
2020; Geiser, 2011). 

Die Beurteilung der Modellpassung von Messmodellen erfolgt über den y?-Dif- 
ferenztest und den CFI-Differenztest (vgl. Abschnitt 6.6.7), sofern die Modelle hie- 
rarchisch ineinander geschachtelt sind (z.B. Vergleich des Faktormodells 1. und 2. 
Ordnung). Nicht geschachtelte Modelle können über die gängigen Modellgütekri- 
terien (vgl. Abschnitt 6.6.6) miteinander verglichen werden. 

Im Anschluss an die Überprüfung der Faktorstruktur wird die Zuverlässigkeit 
der verwendeten Skalen anhand der modellbasierten Reliabilitätskoeffizienten be- 
stimmt, die im Gegensatz zu den klassischen Methoden der Reliabilitätsschätzung 
im Rahmen der CFA anhand der Modellparameter geschätzt werden (Raykov & 
Marcoulides, 2011; Schermelleh-Engel & Gäde, 2020). Als Reliabilitätskoeffizienten 
werden neben Cronbachs Alpha, welcher auf der strengen Annahme von essentiel- 
ler Tau-Äquivalenz (gleiche Faktorladungen) als Stufe der Messäquivalenz der Item- 
variablen beruht, auch McDonalds Omega berichtet, der lediglich Tau-Kongeneri- 
tät der Itemvariablen (unterschiedlich hohe Faktorladungen) voraussetzt (Schermel- 
leh-Engel & Gäde, 2020). Für die Interpretation der Höhe der Reliabilitätskoeffi- 
zienten gilt, dass Werte > .70 als akzeptabel, Werte zwischen .80 und .90 als gut und 
Werte > .90 als sehr gut eingestuft werden (Gade, Schermelleh-Engel & Werner, 
2020; Schermelleh-Engel & Gäde, 2020). 
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Deskriptive Statistiken und Intraklassenkorrelation 


Im Anschluss an die Überprüfung der Faktorenstruktur und der Reliabilitäten der 
verwendeten Skalen wurden die deskriptiven Statistiken berechnet. Als Maß für den 
Grad der Abhängigkeiten der Schülereinschätzungen von der Zugehörigkeit zu ei- 
ner Klasse wurde für jedes latente Konstrukt außerdem die Intraklassenkorrelation 
(ICC) ermittelt. Die ICC kann in Mplus mittels der Analyseoption zype=twolevel und 
unter der Verwendung der Klassen-ID als Clustervariable (vgl. Abschnitt 6.4) auto- 
matisch berechnet werden (Geiser, 2011). Die ICC kann Werte zwischen 0 und 1 
annehmen. Hohe Werte für die ICC bedeuten, dass ein hoher Anteil der Gesamtva- 
rianz in der entsprechenden Variable (z.B. Feedbackwahrnehmung) auf die Zuge- 
hörigkeit der Schülerinnen und Schüler zu einer Klasse zurückgeführt werden kann. 

In Kombination mit dem Befehl basic erhält man zusätzlich die deskriptiven Sta- 
tistiken der Variablen (Geiser, 2011). Da in Mplus zwar Mittelwerte und Varianzen, 
jedoch keine Standardabweichungen ausgegeben werden, werden diese aus den ge- 
gebenen Kennwerten berechnet. Die Standardabweichung (s) ist definiert als die 
Quadratwurzel der Varianz (3): 


s = ys? (1) 


6.6.2 Messinvarianzanalysen 


In den Analysen der vorliegenden Arbeit sollen Unterschiede in den Ausprägungen 
der latenten Konstrukte (hier: Feedback und intrinsische Lernmotivation) zwischen 
verschiedenen Gruppen (Schülerinnen und Schüler) verglichen werden. Aus längs- 
schnittlicher Perspektive soll außerdem die Stabilität und Veränderung der latenten 
Konstrukte über die zwei Messzeitpunkte hinweg überprüft werden. Diese Analy- 
sen setzen das Vorliegen der Invarianz der Messungen voraus — d.h., dass die ver- 
wendeten Skalen über die Messzeitpunkte hinweg bzw. in den Gruppen dasselbe 
Merkmal in gleicher Weise (= invariant) messen und dabei vergleichbare psycho- 
metrische Eigenschaften aufweisen (Gäde, Schermelleh-Engel & Brandt, 2020). Für 
die Analysen dieser Arbeit muss beispielsweise für das Feedback-Modell sicherge- 
stellt werden, dass die Feedback-Faktoren zu jedem Messzeitpunkt und in jeder 
Gruppe (also sowohl bei Schülerinnen als auch bei Schülern) in Bezug auf die Mess- 
modelle vergleichbar sind. Mit dem Vorliegen von Messinvarianz wird nachgewie- 
sen, dass beispielsweise Mittelwertveränderungen über verschiedene Messzeit- 
punkte hinweg bzw. Mittelwertunterschiede zwischen den Gruppen „wahre“, d.h. 
durch die zeitliche Veränderung oder die Gruppenzugehörigkeit begründete und 
damit systematische Unterschiede sind. 

Die Prüfung der Messinvarianz für ein Messinstrument über Gruppen bzw. 
Messzeitpunkte erfolgt im Rahmen der konfirmatorischen Faktorenanalyse. In der 
Forschungspraxis hat sich ein schrittweises Vorgehen etabliert, bei dem Schritt für 
Schritt verschiedene Ebenen der Messinvarianz überprüft werden (Schulte et al., 
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2013; Steenkamp & Baumgartner, 1998). Dabei wird der von Brown (2015) vorge- 
schlagene Szep-Up-Ansatz (im Unterschied zum S7ep-Down-Ansatz) gewählt, bei dem 
mit der am wenigsten restriktiven Form der Messinvarianz begonnen wird (d.h. 
konfigurale Invarianz). Anschließend werden in der Modellierung der Messmodelle 
sukzessive verschiedene Restriktionen vorgenommen, die einen höheren Grad der 
Messinvarianz abbilden. Die folgenden Ebenen der Messinvarianz werden unter- 
schieden (Meredith, 1993; vgl. auch Kline, 2016): 


© Konfigurale Messinvarianz (Basismodell ist die am wenigsten restriktive und da- 
mit schwächste Form der Messinvarianz. Sie ist bereits gegeben, wenn die 
Faktorstruktur (d.h. die Anzahl der Faktoren und das Ladungsmuster) in den 
Gruppen bzw. über die Messzeitpunkte hinweg unverändert bleibt. Dabei 
können die spezifischen Parameter über die Zeit hinweg bzw. in den Grup- 
pen noch frei variieren. 

© Schwache faktorielle Messinvarianz (auch metrische Messinvarianz genannt) liegt vor, 
wenn die Faktorladungen über die verschiedenen Gruppen bzw. über die 
Messzeitpunkte hinweg konstant bleiben. 

© Starke faktorielle Messinvarianz (auch skalare Messinvarianz genannt) kann ange- 
nommen werden, wenn darüber hinaus auch die Item-Intercepts (bzw. bei 
ordinalen/kategorialen Variablen die Schwellenwerte) identisch sind. Wenn 
wenigstens starke faktorielle Invarianz gegeben ist, können die latenten Mit- 
telwerte der Variablen zwischen den Gruppen bzw. die latenten Mittelwert- 
veränderungen über die Zeit sinnvoll miteinander verglichen werden 
(Kleinke et al., 2017). 

© Strikte faktorielle Messinvarianz (auch Messinvarianz des Messfehlers genannt) liegt 
vor, wenn zusätzlich zu den Faktorladungen und Intercepts auch die Residu- 
alvarianzen der manifesten Indikatoren invariant sind (bzw. bei ordina- 
len/kategorialen Variablen die Faktorladungen, Schwellenwerte und Residu- 
alvarianzen). Diese restriktivste Form der Messinvarianz wird in der For- 
schungspraxis aber nur selten erreicht (Meredith, 1993) und wird daher nur 
selten geprüft (Kleinke et al., 2017). 


Da vollständige starke faktorielle Messinvarianz in der Forschungspraxis selten er- 
reicht werden kann, ermöglicht auch das Vorliegen von partieller Messinvarianz einen 
Vergleich von latenten Mittelwerten und Beziehungen zwischen latenten Variablen 
(Byrne et al., 1989; Steenkamp & Baumgartner, 1998). Partielle Messinvarianz liegt 
vor, wenn sich ein Teil der Modellparameter zwischen den Gruppen bzw. über die 
Zeit hinweg bedeutsam unterscheidet, die restlichen Parameter hingegen invariant 
modelliert werden. Für sinnvolle Vergleiche der latenten Mittelwerte sollten dabei 
jedoch mindestens zwei Items pro Faktor über vollständige schwache und starke 
faktorielle Messinvarianz verfügen (Byrne et al., 1989). 
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Welche Form der Messinvarianz in den Daten vorliegt, wird über Vergleiche der 
unterschiedlich restriktiven Messmodelle geprüft. Als Kriterien für den Modellver- 
gleich zwischen den restriktiveren Formen der Messinvarianz und dem konfiguralen 
Basismodell dient zunächst die Beurteilung der gängigen Fit-Indizes (RMSEA, CFI, 
TLI; vgl. Abschnitt 6.6.6). Generell gilt, dass das sparsamere Modell mit den besten 
Fit-Werten gewählt wird (Geiser, 2011). Zur inferenzstatistischen Absicherung der 
Frage, welches Modell besser an die Daten passt, wird der y?-Differenztest heran- 
gezogen. Aufgrund der Stichprobensensitivität des y?-Differenztests wird empfoh- 
len, zusätzlich den CFI-Differenztest zu verwenden (Chen, 2007; Cheung & Rens- 
vold, 2002; Meade et al., 2008). 


6.6.3 Modellierung und Analyse von Veränderung über die Zeit 


Um die Veränderung der Wahrnehmung in den Feedbackdimensionen und der Ein- 
schätzung der intrinsischen Lernmotivation der Schülerinnen und Schüler über die 
Zeit sowie Unterschiede zwischen den Schülerinnen und Schülern in diesen intra- 
individuellen Veränderungen zu untersuchen, wurden Latent-True-Change-Modelle 
(LTC-Modell; auch True-Intraindividual-Change-(TIC)-Mode/s genannt; Steyer et al, 
1997; Steyer et al., 2000) geschätzt. Das LTC-Modell ist ein Strukturgleichungsan- 
satz, bei dem durch die Modellierung einer Differenzvariable interindividuelle Un- 
terschiede (d.h. Unterschiede in einer Variable zwischen Personen) in intraindivi- 
duellen Veränderungen (d.h. Veränderungen einer Person in einer Variable zu ver- 
schiedenen Zeitpunkten) auf latenter, d.h. messfehlerbereinigter Ebene untersucht 
werden (Dietrich, 2019; Geiser, 2011; Reuter et al., 2010). Der wesentliche Unter- 
schied dieses Ansatzes gegenüber autoregressiven Modellen ist, dass Veränderun- 
gen direkt durch latente Differenzvariablen modelliert werden (vgl. Geiser, 2011; 
Gniewosz & Gniewosz, 2018). 

Der Ausgangspunkt eines LTC-Modells ist ein longitudinales (Latent- 
State- )Modell im Rahmen einer CFA (Geiser, 2011; Anwendung bei Reuter et al., 
2010), das fiir die einzelnen Konstrukte zunachst separat modelliert wird. In Abbil- 
dung 10a ist exemplarisch ein langsschnittliches Messmodell mit zwei Erhebungs- 
zeitpunkten und mit je zwei manifesten Indikatoren dargestellt. Als Voraussetzung 
der längsschnittlichen Messmodelle muss mindestens starke faktorielle Messinvari- 
anz (Faktorladungen und Intercepts invariant) vorliegen (vgl. Abschnitt 6.6.2). 

Die latenten Konstrukte wurden über Izem-Parcels (Bandalos 2002, 2008; Little et 
al. 2013) für jeden Messzeitpunkt modelliert. Bei diesem Verfahren werden einzelne 
Items über Mittelwertbildung zu mehreren Päckchen zusammengefasst, die auch als 
Item-Parcels bezeichnet werden (Schermelleh-Engel & Gäde, 2020). Diese Methode 
schlagen Raykov und Marcoulides (2011) für Variablen mit zwei bis vier Antwort- 
kategorien vor, die streng genommen nicht als kontinuierlich, sondern als geordnet 
kategorial eingestuft werden. Anstelle der einzelnen kategorialen Variablen können 
diese Parcels im Strukturgleichungsmodell aufgrund ihrer größeren Anzahl an Ab- 
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stufungen als annähernd kontinuierliche Indikatoren verwendet werden (Schermel- 
leh-Engel & Gade, 2020). Gleichzeitig ermöglicht die Methode des Item-Parceling es, 
die Anzahl der Parameter zu reduzieren und trotzdem stabile Parameterschätzun- 
gen zu erreichen (Little et al., 2002; Little et al., 2013). Die Item-Parcels wurden dabei 
unter Verwendung des Balancing-Ansatzes gebildet, indem die Items mit hohen und 
niedrigen Faktorladungen gleichmäßig auf die Parcels verteilt werden (Little et al., 
2002; Little et al., 2013). 

Zur Skalierung der latenten Faktoren wurde die Effects Coding Methode (Little et 
al., 2006) verwendet. Hierbei wird der Durchschnitt aller Faktorladungen auf 1 und 
der Durchschnitt der Intercepts auf 0 fixiert. Dadurch wird die Varianz der latenten 
Variable durch den Durchschnitt der Indikator-Varianzen gebildet und der Mittel- 
wert der latenten Variable als Durchschnitt der Indikator-Mittelwerte geschätzt. Der 
Effect Coding Ansatz ist somit dadurch gekennzeichnet, dass die latente Variable die- 
selbe (unstandardisierte) Metrik aufweist wie der Durchschnitt aller manifesten In- 
dikatoren (Brown, 2015). Im Unterschied dazu wird bei der stärker verbreiteten 
Methode des Referenzindikators die Ladung eines ausgewählten Indikators auf 1 
fixiert, sodass die Varianz und der Mittewert der latenten Variable durch die Varianz 
und den Mittelwert des Referenzindikators bestimmt wird (Brown, 2015). 

In dem längsschnittlichen Messmodell wurde der indikatorspezifische Effekt 
über die Spezifikation von Residualkorrelationen modelliert (Brown, 2015; Geiser, 
2011). Hierzu wurden im Modell Kovarianzen bzw. Korrelationen zwischen Mess- 
fehlern derselben Items über die verschiedenen Messzeitpunkte zugelassen (Rein- 
ecke et al., 2011). So wird beispielsweise angenommen, dass der Zusammenhang 
zwischen den Messfehlern der Items zu einer Variable zu jedem Messzeitpunkt 
nicht auf die Zusammenhänge im Modell zurückzuführen ist, sondern durch die im 
Längsschnitt wiederholte Messung gleicher Itemformulierungen oder durch andere 
Einflussfaktoren, die nicht kontrolliert wurden. Das Zulassen der Messfehlerkorre- 
lationen führt zu einer Verbesserung der Modellpassung an die Längsschnittdaten. 

In Abbildung 10b ist ein LTC-Modell dargestellt. Die grundlegende Idee des 
LTC-Modells ist, dass die latente Variable zum zweiten Messzeitpunkt (State 2) zer- 
legt wird in eine latente Ausgangsvariable zum ersten Messzeitpunkt (State 1) und 
eine latente Veränderungsvariable (Differenz State 2-Statel), die die Veränderung 
(Abnahme oder Zunahme) vom ersten Messzeitpunkt zum zweiten Messzeitpunkt 
darstellt (Reuter et al., 2010): 


S2- S1 + (5-8) (2) 


Diese „Reformulierung‘“ des längsschnittlichen Messmodells wird in Abbildung 10b 
gezeigt. Zur Spezifikation der latenten Veränderungsvariable (in Abbildung 10b als 
A gekennzeichnet) wird die von Steyer et al. (2000) vorgeschlagene Parametrisierung 
gewählt, bei der die Veränderungsvariable direkt mit den manifesten Indikatoren 
verbunden ist (vgl. auch Gniewosz & Gniewosz, 2018; Reuter et al., 2010). 
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Abbildung 10: Schematisches längsschnittliches (Latent-State-)Modell und Latent-True-Change-Modell 
für ein Merkmal A. 


Anmerkungen. a: Längsschnittliches (Latent-State-) Modell mit Residualkorrelationen. b: La- 
tent-True-Change-Modell mit Residualkorrelationen. A = Latente Veränderungsvariable. 


Wie in Abbildung 10b dargestellt, gibt es im LTC-Modell pro Konstrukt somit zwei 
latente Variablen: die latente Ausgangsvariable T1, die den Ausgangswert einer la- 
tenten Variable für den ersten Messzeitpunkt abbildet, sowie eine latente Differenz- 
variable T2 —T1 für die Veränderung über die Zeit. Durchschnittliche Veränderun- 
gen lassen sich direkt am Mittelwert der Veränderungsvariable ablesen. Fin positi- 
ver Wert der Veränderungsvariable entspricht einer Zunahme und ein negativer 
Wert einer Abnahme. Interindividuelle Unterschiede im Ausgangswert und in den 
intraindividuellen Veränderungen zeigen sich in der Varianz der Ausgangs- bzw. 
Veränderungsvariable (Steyer et al., 2009). Die Kovarianz zwischen der Ausgangs- 
und Veranderungsvariable ist ein Maß dafür, ob sich Personen je nach Ausgangslage 
unterschiedlich verändern. 

Die latente Differenzvariable (hier: Veränderung der Feedbackqualität und der 
intrinsischen Lernmotivation) wurde in den sich anschließenden Zusammenhangs- 
und Mediatoranalysen als abhängige (endogene) Variable eingesetzt, um interindi- 
viduelle Unterschiede in intraindividuellen Veränderungen durch Prädiktorvariab- 
len (hier: Geschlecht und Vorleistung) vorherzusagen (Geiser, 2011). 


Analyse der Zusammenhänge zwischen den Veränderungen der Konstrukte 


Um die Veränderung der wahrgenommenen Feedbackqualität mit der Veränderung 
der intrinsischen Lernmotivation in Beziehung zu setzen, wurden bivariate Latent- 
True-Change-Modelle (Dietrich, 2019; Ferrer & McArdle, 2010) geschätzt. 
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Abbildung 11 zeigt das schematische bivariate LTC-Modell für den Zusammen- 
hang zwischen zwei Merkmalen A und B. 


Abbildung 11: Schematisches bivariates Latent-True-Change-Modell für den Zusammenhang zwischen 
zwei Variablen A und B. 


Insgesamt wurden vier bivariate Veränderungsmodelle spezifiziert, die Zusammen- 
hänge zwischen den zeitlichen Veränderungen der (1) Wahrnehmung der ergebnis- 
orientierten Dimension und der intrinsischen Lernmotivation, (2) Wahrnehmung 
der prozessorientierten Dimension und der intrinsischen Lernmotivation, (3) Wahr- 
nehmung der selbstregulationsorientierten Dimension und der intrinsischen Lern- 
motivation und schließlich (4) Wahrnehmung der dialogorientierten Dimension 
und der intrinsischen Lernmotivation analysiert. Hierzu werden die spezifizierten 
LTC-Modelle der Konstrukte zu je einem Modell zusammengeführt (Grimm et al., 
2012). Dabei werden folgende Zusammenhänge zwischen den Konstrukten model- 
liert: @) Korrelationen zwischen dem Ausgangswert der Feedbackwahrnehmung 
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und der intrinsischen Lernmotivation zum ersten Messzeitpunkt und (ii) Korrelati- 
onen zwischen den Veränderungswerten der beiden Variablen. Zusätzlich dazu 
werden kreuzverzögerte Effekte (cross-dagged effects) modelliert, um interindividuelle 
Unterschiede in der Veränderung eines Konstrukts durch die zeitlich vorgeordnete 
Ausgangsvariable vorherzusagen. Dabei steht ein kreuzverzögerter Pfad für den Ef- 
fekt von der Feedbackwahrnehmung zum ersten Messzeitpunkt auf die Verände- 
rung der intrinsischen Lernmotivation und ein weiterer Pfad für den Effekt von der 
intrinsischen Lernmotivation zum ersten Messzeitpunkt auf die Veränderung der 
Feedbackwahrnehmung. 


6.6.4 Mediationsmodelle 


Die vermittelnde Rolle der wahrgenommenen Nützlichkeit von Feedback sowie des 
Kompetenzerlebens beim Zusammenspiel zwischen den wahrgenommenen Di- 
mensionen der Feedbackqualität und der Veränderung der intrinsischen Lernmoti- 
vation wurde im Rahmen von Mediatormodellen untersucht. Nach McKinnon 
(2008) kann eine Mediation definiert werden als ,,the addition of a third variable to an 
X > Y relation so that the causal sequences can be modeled such as X causes the mediator, M, 
and M causes Y, that is, X > M > Y“ (McKinnon, 2008, S. 314). Ein einfaches 
Mediationsmodell mit einer Mediatorvariable sowie ein Mediationsmodell mit meh- 
reren Mediatoren sind in Abbildung 12 dargestellt. In dem Modell wird deutlich, 
dass der totale Effekt von einer unabhangigen Variable X auf eine abhangige Vari- 
able Y zerlegt wird in einen direkten Effekt von X auf Y und einen indirekten (me- 
diierenden) Effekt von X auf Y über einen oder mehrere Mediatorvariablen M 
(McKinnon, 2008). Diesem einfachen Mediationsmodell liegt zugrunde, dass M 
durch X vorhergesagt wird (Pfad a) und Y sowohl durch X (Pfad c) als auch durch 
M (Pfad b) vorhergesagt wird. 

Der indirekte Effekt von X auf Y berechnet sich aus dem Produkt der Regres- 
sionskoeffizienten a und b (indirekter Effekt = ax b). Der totale Effekt c berechnet 
sich aus der Summe des direkten Effekts (c) und aller indirekten Effekte: 


c’ = (axb) +c. (3) 


Der totale Effekt in einem Mediationsmodell entspricht statistisch dem Effekt von 
X auf Y in einem bivariaten Regressionsmodell ohne Berücksichtigung von Medi- 
atorvariablen. Dabei muss nach jüngeren Forschungsarbeiten kein statistisch signi- 
fikanter Effekt von X auf Y (totaler Effekt c) ohne Kontrolle von M vorliegen (Ma- 
cKinnon, 2008; Rucker et al., 2011; Zhao et al., 2010.). X kann statistisch signifi- 
kante indirekte und direkte Effekte auf Y ausüben, die aber in gegenläufiger Ein- 
flussrichtung wirken und sich im totalen Effekt gegenseitig aufheben. Dies kann 
dazu führen, dass der totale Effekt verringert wird oder gänzlich verschwindet (sog. 
Suppressor-Effekte, vgl. Preacher & Hayes, 2008; Urban & Mayerl, 2007; Zhao et 
al., 2010). Somit wird der Einfluss von X auf Y in einer Modellschatzung, in der 


98 Methodisches Vorgehen 


lediglich die Regression von Y auf X betrachtet wird, unterschätzt. Folglich kann 
die Zerlegung des totalen Effekts in einen direkten und indirekten Effekt dazu bei- 
tragen, die Bedeutung von X bei der Varianzaufklärung von Y angemessener zu 
spezifizieren (Urban & Mayerl, 2007). 


Mediator 
(M) 


Unbhangige 


Abhangige 
Variable (X) 


Variable (Y) 


&4 


Mediator 
(Mj) 


e2 


Unbhängige 


Abhängige 
Variable (X) 


Variable (Y) 


Abbildung 12: Schematische Darstellung eines einfachen Mediationsmodells (A) sowie eines erweiterten 
Modells mit einer multiplen Mediation (B). 


In den Mediationsanalysen der vorliegenden Arbeit wurde die wahrgenommene 
Feedbackdimension als unabhängige Variable und die wahrgenommene Nützlich- 
keit von Feedback sowie das wahrgenommene Kompetenzerleben als Mediatorva- 
riablen spezifiziert. Als abhängige Variable wurde die latente Differenzvariable ein- 


gesetzt, die die Veränderung der intrinsischen Lernmotivation im Latent-True- 
Change-Modell abbildet. 
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Um die Entstehung von Multikollinearitätseffekten! zu verhindern, die auf- 
grund der hohen Korrelationen zwischen den Feedbackdimensionen auftreten kön- 
nen, wurden die Effekte der einzelnen Feedbackdimensionen als unabhängige Va- 
riablen getrennt voneinander modelliert. 

Für die Mediatoranalysen wurde die in Mplus implementierte model indirect Op- 
tion angewendet. Da herkömmliche Verfahren der Signifikanztestungen von indi- 
rekten Effekten häufig nicht zuverlässig sind und zu verzerrten Ergebnissen führen 
können (Geiser, 2011; MacKinnon, 2008), empfehlen MacKinnon et al. (2004) zur 
Signifikanzprüfung die Betrachtung von Konfidenzintervallen und hierbei insbe- 
sondere die sogenannte Bias-korrigierte Bootstrap-Methode (Geiser, 2011; Ma- 
cKinnon et al., 2004; MacKinnon, 2008). Nach dieser Methode ist ein indirekter 
Effekt auf dem 5%-Niveau signifikant, wenn der Wert Null nicht in das geschätzte 
95%-Bootstrap-Konfidenzintervall um diesen Effekt fällt (Geiser, 2011). Die Kon- 
fidenzintervalle wurden dabei mit Bias-Korrektur auf der Basis von 10.000 
Bootstrap-Stichproben geschätzt; dies erlaubt eine hinreichend genaue Schätzung 
der Grenzen des Konfidenzintervalls (Geiser, 2011). Die Bias-korrigierte 
Bootstrap-Methode ist in Mplus implementiert und kann über den output-Befehl 
cinterval (bcbootstrap) angefordert werden (Geiser, 2011). 


6.6.5 Parameterschaétzung 


Zur Parameterschätzung im Rahmen der konfirmatorischen Faktorenanalysen und 
der Strukturgleichungsanalysen stehen unterschiedliche Schätzverfahren zur Verfü- 
gung. Die am häufigsten verwendete Schätzmethode ist die Maximum-Likelihood- 
Methode (ML-Methode), die bei großen Stichproben zu effizienten und erwar- 
tungstreuen Parameterschätzungen führt (Gäde, Schermelleh-Engel & Brandt, 
2020). Die ML-Methode setzt allerdings voraus, dass die beobachteten Variablen 
normalverteilt sind und ein kontinuierliches Skalenniveau aufweisen (Rhemtulla et 
al., 2012). Bei kontinuierlichen Variablen, die die Annahme der Normalverteilung 
verletzen, kann die robuste ML-Methode (MLR) verwendet werden, bei der die 
Standardfehler mithilfe eines sog. „Sandwich-Schätzers“ korrigiert werden (Gäde, 
Schermelleh-Engel & Brandt, 2020). ML und MLR sind auch auf Datensätze mit 
fehlenden Werten anwendbar, sofern die fehlenden Daten MCAR bzw. MAR (vgl. 
Kapitel 6.5) sind (Gäde, Schermelleh-Engel & Brandt, 2020; Reinecke, 2014). 
Wenn allerdings kategoriale Variablen (z.B. Likert-Skalen mit einer begrenzten 
Anzahl an geordneten Antwortkategorien) vorliegen, dann kann die Verwendung 
der ML-Schätzmethode zu verzerrten Parameterschätzungen sowie zu inkorrekten 
Standardfehlern und Modell-Fit-Tests führen, insbesondere dann, wenn Variablen 
weniger als fünf Kategorien oder eine starke Abweichung von der Normalverteilung 


1 Multikollinearität wird als „die gegenseitige lineare Abhängigkeit“ (Urban & Mayerl, 2014, S. 44) 
von zwei oder mehreren Prädiktoren bezeichnet. Eine hohe Multikollinearität kann zu Verzerrungen 
der Parameterschätzungen und zu einer Überschätzung der Standardfehler der Schätzwerte führen 
(Urban & Mayerl, 2014). 
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(Schiefe > 2) aufweisen (Muthén & Kaplan, 1985; Rhemtulla et al., 2012; West et 
al., 1995). In der Forschungspraxis werden ordinalskalierte Variablen mit geordne- 
ten Antwortkategorien häufig als kontinuierliche Variablen behandelt und Metho- 
den für kontinuierliche Variablen mit ML-Schätzer genutzt (Byrne, 2012), wenn da- 
von ausgegangen wird, dass mit mehreren beobachteten kategorialen Indikatoren 
ein zugrunde liegendes kontinuierliches latentes Konstrukt erfasst werden soll (Eid 
& Schmidt, 2014). In der Literatur gibt es Hinweise dafür, dass kategoriale Variablen 
als kontinuierliche Variablen behandelt werden können, wenn diese ausreichend 
Kategorien aufweisen und annähernd normalverteilt sind (Babakus et al., 1987; 
Muthen & Kaplan, 1985). Bentler und Chou (1987) argumentieren sogar, dass bei 
normal verteilten kategorialen Variablen auch Methoden für kontinuierliche Vari- 
ablen genutzt werden können, wenn die Variablen mindestens vier Abstufungen 
aufweisen. Wird das kategoriale Skalenniveau explizit berücksichtigt, verbessert sich 
die Genauigkeit der Parameterschätzungen (Kühnel, 1993). So konnten Rhemtulla 
et al. (2012) in einer Simulationsstudie zeigen, dass bei Variablen mit weniger als 
fünf Antwortkategorien WLS (weighted least squares)-Verfahren mit robuster Schät- 
zung der Standardfehler und der y?-Statistik zu effizienteren Schätzergebnissen füh- 
ren. In Mplus ist für kategoriale Variablen standardmäßig der WLSMV-Schätzer 
(WLSMV = weighted least squares estimator with standard errors and mean- and variance ad- 
Justed chi-square test statistics) implementiert, der auch bei kleinen Stichprobengrößen 
relativ stabile Modelle schätzen kann und zudem auch noch bei schief verteilten 
kategorialen Variablen unverzerrte Parameterschätzungen liefert (Urban & Mayerl, 
2014). In der vorliegenden Arbeit findet dieses Verfahren bei den Modellschätzun- 
gen mit kategorialen Variablen Anwendung. 


6.6.6 Modellgiitekriterien 


Zur Beurteilung der Qualität eines geschätzten Modells wurden unterschiedliche 
statistische Gütekriterien (Fit-Indizes) herangezogen (vgl. Hu & Bentler, 1999; 
Schermelleh-Engel et al., 2003; West et al., 2012). 

Die Übereinstimmung zwischen der theoretisch spezifizierten Modellstruktur 
und der empirisch beobachteten Datenstruktur wird klassischerweise mit dem x?- 
Anpassungstest geprüft. Der y?-Wert ist umso kleiner, je kleiner die Differenz zwi- 
schen der geschätzten Stichprobenkovarianzmatrix und der Populationskovarianz- 
matrix ist, also je besser das aus der Stichprobe geschätzte Modell in der Grundge- 
samtheit zu den Daten passt (Reinecke & Pöge, 2010). Ein nicht signifikanter y2- 
Test gibt an, dass sich die modellbestimmte und die empirisch beobachtete Daten- 
struktur nicht unterscheiden — das Modell also zu den empirischen Daten passt 
(Geiser, 2011; Urban & Mayerl, 2014). Außerdem gilt, dass das Modell mit dem 
geringeren y?-Wert zu bevorzugen ist (Gade, Schermelleh-Engel & Brandt, 2020). 
Zusätzlich zum x?-Anpassungstest wird empfohlen das Verhältnis von modellspe- 
zifischen Freiheitsgraden zum y?-Wert (x?/df) als Fit-Index heranzuziehen, wobei 
Werte < 3 auf eine akzeptable Modellgüte und Werte < 2 auf eine hohe Modellgüte 
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hinweisen (Schermelleh-Engel et al., 2003). Allerdings ist zu berücksichtigen, dass 
der y?-Anpassungstest an mehrere Voraussetzungen geknüpft ist, die mit empirisch 
gewonnenen Daten kaum erfüllt werden (Reinecke & Pöge, 2010). Hierzu gehören 
beispielsweise die Multinominalverteilung der manifesten Variablen und eine hin- 
reichende Stichprobengröße (Reinecke & Pöge, 2010). Nicht normalverteilte Vari- 
ablen führen zu überschätzten y?-Werten und zu einer Verzerrung der Standardfeh- 
ler (Reinecke & Pöge, 2010). Bei großen Fallzahlen wird der Test oftmals auch bei 
sehr guter Passung an die Daten signifikant und bei kleinen Fallzahlen signalisiert 
der Test eine inflationiert gute Modellanpassung (Reinecke & Pöge, 2010; Scher- 
melleh-Engel et al., 2003; Urban & Mayerl, 2014). 

Aufgrund der Sensitivität des x?-Anpassungstests sollten auch weitere Fit-Indi- 
zes berücksichtigt werden. Als komparative Fit-Indizes (auch als inkrementelle Fit- 
Indizes bezeichnet, vgl. z.B. Hu & Bentler, 1999) dienen der Comparative Fit Index 
(CFI) sowie der Tucker-Lewis Index (TLI). Beide vergleichen den Fit des geschätzten 
Modells mit dem Fit eines sog. Nullmodells bzw. Unabhängigkeitsmodells (mit un- 
korrelierten und messfehlerfreien Indikatorvariablen) und sind Maße dafür, wieviel 
besser das untersuchte Modell zu den Daten passt. Der CFI kann Werte zwischen 
0 und 1 annehmen, für den TLI sind theoretisch auch Werte über 1 möglich. Für 
eine hohe Modellgüte sollten der CFI und der TLI einen Wert 2 .97 und für eine 
akzeptable Modellgüte einen Wert = .95 annehmen (Schermelleh-Engel et al., 2003; 
West et al., 2012). 

Der Root Mean Square Error of Approximation (RMSEA) ist ein Maß zur Beurtei- 
lung der approximativen Passung von Modell und Daten. Werte des RMSEA klei- 
ner als .05 können als kleine Differenz und damit als guter Modell-Fit interpretiert 
werden; Werte zwischen .05 und .08 können als mittlere Differenz bewertet werden 
und verweisen damit auf einen akzeptablen Modell-Fit; Werte größer als .08 können 
als große Differenz interpretiert werden und zeigen damit einen unbefriedigenden 
Modell-Fit (Reinecke & Pöge, 2010). Neben der Höhe des RMSEA sollte auch sein 
90%-Konfidenzintervall in der Modellbeurteilung berücksichtigt werden (Geiser, 
2011; Urban & Mayerl, 2014). Die geschätzten Grenzwerte des 90%-Konfidenzin- 
tervalls informieren darüber, wie präzise die RMSEA-Schätzung ist. Idealerweise 
sollte das 90%-Konfidenzintervall am unteren Ende einen Wert von 0.00 (mindes- 
tens jedoch kleiner als 0.05) und am oberen Ende einen Wert unter 0.08 aufweisen 
(Urban & Mayerl, 2014). Zusätzlich liegt als Beurteilungskriterium noch der sog. zest 
of close fit, bei dem die Nullhypothese besagt, dass RSMEA < .05 sein soll (Geiser, 
2011; Urban & Mayerl, 2014). Ein nicht signifikanter zest of close fit besagt somit, dass 
das Modell einen ausreichend guten Fit aufweist (close ji). 

Schließlich wird noch der Wert des Standardized Root Mean Square Residual 
(SRMR) als absoluter Fit-Index zur Evaluation der Modellgüte herangezogen. Der 
SRMR bestimmt die standardisierte Abweichung zwischen der beobachteten Da- 
tenstruktur und der geschätzten Modellstruktur. Werte < .05 weisen auf eine hohe 


Modellgüte und Werte < .10 auf eine akzeptable Modellgüte hin. 
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In Tabelle 8 sind die wichtigsten Fit-Indizes zur Beurteilung der Modellgüte und 
die diesbezüglichen Cut-Off-Werte zusammenfassend dargestellt. 


Tabelle 8: Übersicht zentraler Modellgütekriterien (Fit-Indizes) 


Fit-Index Guter Modell-Fit Akzeptabler Modell-Fit 
x? Modell mit der niedrigerer y?-Statistik wird vorgezogen 
eld ZEE EE 

CFI CFI 2 .97 CFI 2 .95 

TLI TLI 2 .97 TLI 2 .95 
RMSEA RMSEA < .05 RMSEA < .08 

p (RMSEA < .05) sollte nicht signifikant sein 
90%-Konfidenzintervall (CH unterer Wert CI < .05 und oberer Wert CI < .08 
SRMR SRMR < .05 SRMR  .10 


Zur Einschätzung des Modell-Fits empfiehlt es sich, nicht nur einen der genannten 
Fit-Indizes heranzuziehen, da die Fit-Indizes unterschiedlich sensibel auf verschie- 
dene Kriterien wie Stichprobengröße, Modellkomplexität oder die Verletzung der 
Normalverteilung reagieren (Brown, 2015; Hu & Bentler, 1999; Weiber & Mühl- 
haus, 2014). Stattdessen sollte zur Modellevaluation eine Kombination verschiede- 
ner Gütekriterien verwendet werden. Als günstige Kombinationen bei großen Stich- 
proben (N > 250) gelten der SRMR in Verbindung mit CFI oder TLI (Hu & Bent- 
ler, 1999). 

Im Rahmen der konfirmatorischen Faktoranalysen werden neben den Modell- 
gütekriterien auch die Parameterschätzungen beurteilt. Die standardisierten Faktor- 
ladungen sollten statistisch signifikant von 0 verschieden sein und einen Wert 2 .50 
aufweisen (Urban & Mayerl, 2014; Weiber & Mühlhaus, 2014). Zudem werden die 
geschätzten R?-Werte als Maß der Indikatorreliabilität betrachtet (Geiser, 2011; 
Weiber & Mühlhaus, 2014). Diese Werte geben den Anteil der Varianz eines mani- 
festen Indikators an, der durch das latente Konstrukt erklärt wird (Weiber & Mühl- 
haus, 2014). Die Indikatorreliabilitat sollte nach Weiber und Mühlhaus (2014) 
Werte 2 .40 annehmen. 
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6.6.7 Modellvergleiche 


Für den Vergleich von zwei hierarchisch geschachtelten Daten, bei dem geprüft 
wird, ob sich der Modell-Fit eines restringierten Modells (mit weniger frei geschätz- 
ten Parametern) von dem Modell-Fit eines unrestringierten Modells signifikant un- 
terscheidet, wurde der y?-Differenztest herangezogen (Hu & Bentler, 1999). Ein 
nicht signifikanter y?-Differenztest bedeutet, dass das restringierte, sparsamere Mo- 
dell nicht schlechter auf die Daten passt als das unrestringierte Modell und daher 
beibehalten werden sollte. Bei einem signifikanten y?-Differenztest sollte das rest- 
ringierte Modell verworfen werden, da es den Modell-Fit im Vergleich zum unrest- 
ringierten Modell substanziell verschlechtert. Dieser Modellvergleich wurde bei- 
spielweise bei den Invarianzanalysen bzw. Gruppenvergleichen in der vorliegenden 
Arbeit verwendet. 

Bei der Verwendung des y?-Differenztests müssen die Schätzverfahren berück- 
sichtigt werden. Wenn in den Daten eine multivariate Normalverteilung gegeben ist 
und die y?-Werte somit mittels der ML-Schätzmethode ermittelt wurden, lässt sich 
der y?-Differenztest einfach durchführen (Eid & Schmidt, 2014). Basiert der Mo- 
dellvergleich wie im vorliegenden Fall jedoch auf y?-Statistiken, die auf Grundlage 
einer robusten Schätzmethode (z.B. MLR bei kontinuierlichen Variablen bzw. 
WLSMV bei kategorialen Variablen) gewonnen wurden (vgl. Abschnitt 6.6.5), muss 
ein skalierter y?-Differenztest (Ayko mit Adj), der die Abweichung von der Nor- 
malverteilung korrigiert, durchgeführt werden (Satorra & Bentler, 2001, 2010). Die- 
ser robuste y?-Differenztest ist in Mplus implementiert und kann somit automati- 
siert ermittelt werden. 

Da der y?-Differenztest jedoch abhängig von der Normalverteilungsannahme 
und der Stichprobengröße ist, empfehlen Cheung und Rensvold (2002) sowie 
Meade et al. (2008), den CFI-Differenztest zur Entscheidung der Modellpassung 
heranzuziehen (Chen, 2007; Cheung & Rensvold, 2002). Dabei sollte die Differenz 
des CFI zwischen dem Basismodell und dem jeweiligen Modell mit Restriktionen 
nicht mehr als .01 betragen (Chen, 2007; Cheung & Rensvold, 2002). 


7 Ergebnisse 


Im folgenden Kapitel werden die Ergebnisse der Datenanalyse berichtet, um die in 
Kapitel 5 abgeleiteten Hypothesen zu prüfen. Die Ergebnisdarstellung gliedert sich 
dabei entlang der aufgestellten Forschungsfragen. Die Abschnitte 7.1 bis 7.3 wid- 
men sich der Hauptforschungsfrage I: Nach der Prüfung der faktoriellen Struktur des 
Konstrukts der wahrgenommenen Feedbackqualität und der Zusammenfassung der 
deskriptiven Befunde zur wahrgenommenen Feedbackqualität im Deutschunter- 
richt (Abschnitt 7.1), werden in Abschnitt 7.2 die Ergebnisse hinsichtlich der Mess- 
invarianz der eingesetzten Instrumente zur Erfassung der wahrgenommenen Feed- 
backqualität berichtet. In Abschnitt 7.3 werden im Rahmen eines Latent-True- 
Change-Modells die Ergebnisse zur (differenziellen) Veränderung der wahrgenom- 
menen Feedbackqualität über die Zeit präsentiert. Abschnitt 1.1 werden die Ergeb- 
nisse zur Hauptforschungsfrage II in Bezug auf die reziproken Zusammenhänge zwi- 
schen den Dimensionen der Feedbackqualität und der intrinsischen Lernmotivation 
sowie zwischen den Veränderungen der beiden Konstrukte im Laufe des Schulhalb- 
jahres dargestellt. Schließlich widmet sich Abschnitt 7.5 der Hauprforschungsfrage III 
hinsichtlich der indirekten Effekte von wahrgenommener Feedbackqualität auf die 
Veränderung der intrinsischen Lernmotivation. 
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7.1 Wahrnehmung von Feedback im Deutschunterricht 


In den nachstehenden Abschnitten wird die (längsschnittliche) Faktorenstruktur 
des Konstrukts der Feedbackqualität zu beiden Messzeitpunkten separat sowie im 
Rahmen eines gemeinsamen, längsschnittlichen Strukturmodells geprüft (Tez/frage- 
stellung Fa). 


7.1.1  Faktorenstruktur der Skalen zur Feedbackwahrnehmung 


Zur Überprüfung der faktoriellen Struktur der wahrgenommenen Feedbackqualitat 
in der vorliegenden Stichprobe wurden drei Modelle jeweils separat für beide Mess- 
zeitpunkte spezifiziert (s. Abbildung 13). 


Ergebnis 


| 


= 


Dialog 


Feedback 


Feedback 


Selbstregulation 


Abbildung 13: Schematische Darstellung des 1-Faktor-Modells (links), 4-Faktormodells mit korrelierten 
Faktoren (Mitte) und Faktormodells 2. Ordnung (rechts) 


Im ersten Schritt wurde ein 1-Faktormodell (Generalfaktor- oder gFaktormodell) 
geprüft (Modell I), in dem alle 16 Items der Feedbackqualität auf einem einzigen 
Faktor laden. Bei einem guten Modell-Fit müsste auf inhaltlicher Ebene davon aus- 
gegangen werden, dass nicht zwischen ergebnisorientierter, prozessorientierter, 
selbstregulationsorientierter und dialogorientierter Dimension unterschieden wer- 
den kann, sondern dass sich die Feedbackqualität anhand einer Dimension abbilden 
lässt. Das zweite Modell (ID) unterscheidet zwischen vier korrelierten Faktoren als 
voneinander abgrenzbare Subdimensionen der Feedbackqualität (Ergebnis, Pro- 
zess, Selbstregulation und Dialog). 
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Abschließend wurde in Modell III noch ein Faktormodell 2. Ordnung über- 
prüft, in welchem die Feedback-Faktoren 1. Ordnung auf einem Faktor 2. Ordnung 
laden. Dabei wurde theoretisch angenommen, dass den vier Dimensionen ein ge- 
meinsamer Faktor zugrunde liegt und darüber hinaus noch ein Anteil spezifischer 
Varianz der einzelnen Feedbackdimensionen vorliegt (Geiser, 2011). Die Fit-Statis- 
tiken für die spezifizierten Modelle sind jeweils separat für beide Messzeitpunkte in 
Tabelle 9 dargestellt. 


Tabelle 9: Ergebnisse der konfirmatorischen Faktorenanalyse zur Feedbackqualität 
zu Beginn und zur Mitte des Schuljahres (MZP 1 und MZP 2) 


a © MZP 2 df a en Cre CFI TUI SRMR 
I 1 1 557.75* 104 5.36 ee <.001 90 88  .06 
I 1 2 486.02* 103 4.72 Pa <.001 .91 90 06 
Il 4 1 248.84" 98 2.54 nie 94 97 96 04 
Il 4 2 220.13* 98 2.25 re 87 97 97 03 
II 4/1 1 250.93* 100 2.51 ee 95 97 96 04 
II 4/1 2 210.60* 100 2.12 08 95.98.97 04 


Anmerkungen. Model I: Generalfaktormodell; Modell II: 4-Faktormodell; Modell III: Faktor- 
modell 2. Ordnung. *p < .001. 


Bei Vergleich der Modell-Fit-Statistiken zeigt sich, dass das geschätzte Generalfak- 
tormodell (Modell I) zu beiden Messzeitpunkten die Daten am schlechtesten repli- 
ziert. Die Werte für den CFI, TLI und SRMR liegen außerhalb des geforderten 
Wertebereichs, sodass dieses Modell verworfen werden muss. Modell II und III 
zeigen zwar einen signifikanten x?-Wert, allerdings verweisen die anderen Fit-Indi- 
zes auf eine gute Anpassungsgüte des 4-Faktormodells und des Faktormodells 2. 
Ordnung. Der nach Satorra und Bentler (2001) korrigierte y?-Differenztest für den 
Modellvergleich zeigt für Messzeitpunkt 1 eine signifikante Differenz zwischen Mo- 
dell II und Modell II (tı: Ay?kor = 7.01, Adf = 2, p = .03), wodurch das Modell 2. 
Ordnung (Modell III) verworfen werden müsste. Der Modellvergleich zu Messzeit- 
punkt 2 hingegen zeigt keine bedeutsame Verschlechterung durch das restringier- 
tere Modell 2. Ordnung (tz: Ayko: = 0.65, Adf= 2, p = .72), wodurch es angenom- 
men werden miisste. Nach inhaltlichen Gesichtspunkten entspricht das Modell mit 
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vier korrelierten Faktoren 1. Ordnung eher dem Forschungsziel der Arbeit, die Di- 
mensionen der Feedbackqualität einzeln in die Analysen einführen zu können und 
damit möglichst differenzierte Aussagen über die spezifischen Effekte der einzelnen 
Dimensionen treffen zu können. Nach Abwägung dieser inhaltlichen Kriterien fällt 
die Entscheidung für das Strukturmodell mit vier korrelierten Faktoren und gegen 
das Modell 2. Ordnung. 

Die standardisierten Faktorladungen und die geschätzten R?-Werte als Maße für 
die Reliabilitäts-Schätzungen der manifesten Indikatoren (Geiser, 2011) können der 
Tabelle 10 entnommen werden. Alle Indikatoren verfügen über signifikante 
(p < .001) standardisierte Faktorladungen, die über dem Schwellenwert von .50 lie- 
gen (ti: 51 SA < .77: tz: .66 < à < .87). Die R?-Werte deuten auf überwiegend hohe 
Indikatorreliabilitäten hin. 


Tabelle 10: Standardisierte Faktorladungen (A) und Reliabilitäts-Schätzungen (R?) 
der Indikatoren im 4-Faktormodell der Feedbackqualität zu Beginn und zur Mitte 
des Schuljahres (MZP 1 und 2) 


MZP1 MZP2 
Skala /Item x R? A R2 
Ergebnisorientierte Dimension 
fbev3 .66 43 82 .68 
fbev4 .69 .47 .82 .67 
fbev6 71 51 .73 .54 
fbpo1 .69 .47 .75 .56 
Prozessorientierte Dimension 
fbpo5 .62 39 .66 .44 
fbpo6 .75 56 80 .65 
fbpo7 71 By 81 .65 
fbpo9 .70 49 71 .50 
Selbstregnlationsorientierte Dimension 
fbse4 51 .26 .67 45 
fbse6 71 51 77 .59 
fbse8 .62 .38 .70 49 
fbse9 AS 56 .74 .55 
Dialogorientierte Dimension 
fbdil .65 .43 13 Fie) 
fbdi3 T .50 .74 155 
fbdi4 .64 41 72 52 
fbdi6 .77 .57 .87 .76 


Anmerkungen. Alle Angaben sind auf einem Niveau von p < .001 signifikant. 
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In Tabelle 11 sind die Interkorrelationen der latenten Faktoren des 4-Faktormodells 
dargestellt. Die Korrelationen liegen im Bereich .62 < r < .84 (tı) bzw. 59 < r < .83 
(t2), wobei die Korrelation zwischen der ergebnisorientierten und der prozessorien- 
tierten Dimension am höchsten ausfällt. 


Tabelle 11: Latente Interkorrelationen der Faktoren der Feedbackskalen zu Beginn 
(ti) und zur Mitte (t2) des Schuljahres 


(1) (2) (3) (4) 
(1) EO - 84 78 62 
(2) PO 83 : 83 68 
(3) SO 69 82 : 65 
(4) DO 59 63 64 > 


Anmerkungen. Unterhalb der Diagonalen sind die Korrelationen zu tı und oberhalb zu tz; EO 
= Ergebnisorientierte Dimension; PO = Prozessorientierte Dimension; SO = Selbstregula- 
tionsorientierte Dimension; DO = Dialogorientierte Dimension; alle Korrelationskoeffi- 
zienten sind auf einem Niveau von p < .001 signifikant. 


71.2 Deskriptive Ergebnisse 


In Tabelle 12 sind zum einen die Mittelwerte, Standardabweichungen und Intraklas- 
senkorrelationen (ICC) der manifesten Subskalen der Feedbackqualitat sowie auf 
latenter Ebene die modellbasierten Reliabilitatskoeffizienten (Cronbachs « bzw. 
McDonalds w) dargestellt. Die deskriptiven Werte geben Auskunft darüber, wie das 
Feedback im Unterrichtsgespräch durch die Schülerinnen und Schüler wahrgenom- 
men wird. Ein hoher Wert repräsentiert dabei eine hohe Ausprägung der Feedback- 
dimension. Die Mittelwerte der Subskalen liegen alle über dem theoretischen Mit- 
telwert von 2.5. Zu Beginn des Schuljahres ist die ergebnisorientierte Dimension 
von Feedback am höchsten ausgeprägt (MW = 3.09, SD = 0.54), während zur Mitte 
des Schuljahres die dialogorientierte Dimension von Feedback die höchste Ausprä- 
gung aufweist (MW = 3.05, SD = 0.61). Auf deskriptiver Ebene zeigt sich außer- 
dem, dass die Ausprägung der ergebnisorientierten Dimension im Laufe des Schul- 
halbjahres sinkt, während die berichteten Ausprägungen der anderen drei Dimensi- 
onen steigen. 
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Tabelle 12: Skalenmittelwerte (MW), Standardabweichungen (SD), Reliabilitäten (« 
und @) und Intraklassenkorrelationen (ICC) der Feedbackdimensionen zu Beginn 
und zur Mitte des Schuljahres 


Skala Beginn des Schuljahres Mitte des Schuljahres 

N MV SD « w ICC N MV SD « w ICC 
EO 807 3.09 0.54 .72 .72 .27 697 2.98 0.56 .80 .80 .25 
PO 805 2.95 0.57 .74 .74 19 696 2.98 0.59 .77 .77 221 
SO 805 2.91 053 68 68 12 696 2.96 0.58 .76 .76 19 
DO 807 2.94 0.58 .72 .72 .16 697 3.05 0.61 .78 .77 21 


Anmerkungen. EO = ergebnisorientierte Dimension; PO = prozessorientierte Dimension; 
SO = selbstregulationsorientierte Dimension; DO = dialogorientierte Dimension. 


Die Reliabilitäten (« und w) der Subskalen variieren zwischen .68 und .72 (tı) bzw. 
.76 und .80 (t2) und sind damit — mit Ausnahme der Skala Selbstregulationsorien- 
tierte Dimension zu tı — als zufriedenstellend bis gut zu bewerten. Abschließend ist 
noch die Intraklassenkorrelation (ICC) angegeben. Dieser gibt den prozentualen 
Anteil der Gesamtvarianz an, der auf Unterschiede zwischen den Klassen zurück- 
zuführen ist (Lüdtke et al., 2006). Die Ausprägungen für die ICC zeigen, dass zwi- 
schen 12% bzw. 19% (selbstregulationsorientierte Dimension zu tı bzw. t2) und 
27% bzw. 25% (ergebnisorientierte Dimension zu tı bzw. t2) der Varianz in den 
Schülerwahrnehmungen auf die Zugehörigkeit zu einem Deutschkurs und nicht auf 
individuelle Wahrnehmungstendenzen einzelner Schülerinnen und Schüler zurück- 
gehen. Die ICC-Werte sind vergleichbar mit Werten in Studien, in denen Unter- 
richtsmerkmale untersucht werden (Fauth et al., 2014; Igler et al., 2019; Lüdtke et 
al., 2006; Praetorius et al., 2018; Wagner et al., 2016; Willems, 2011). 


71.3 Modellierung der Feedbackqualität im Längsschnitt 


Als Ausgangspunkt der längsschnittlichen Analyse der Feedbackqualität wurde ein 
unrestriktives, longitudinales Latent-State-Modell (LS-Modell) geschätzt, in wel- 
chem noch keine Annahmen über zeitlich invariante Parameter getroffen werden. 
Hierzu wurden die 4-Faktor-Modelle von Messzeitpunkt 1 und Messzeitpunkt 2 zu 
einem LS-Modell verbunden. Die Korrelationen zwischen den latenten (State-)Fak- 
toren wurden frei geschätzt. Ebenso wurden Residualkorrelationen zwischen Indi- 
katoren verschiedener Messzeitpunkte zugelassen, um hiermit indikatorspezifische 
Effekte abzubilden (vgl. Abschnitt 6.6.3). Das Modell weist einen guten Modell-Fit 
auf (x? = 602.01, df= 420, p(y?) < .001, CFI = .98, TLI = .97, RMSEA [90% CI] = 
02 [.02, .03], Cri: = 1.00, SRMR = .04). Die standardisierten Faktorladungen der 
Indikatoren der Feedbackwahrnehmung liegen im Bereich Au/ M2 = .53/ .67 und 
Aa/ M2 = .76/ .87 (p < .001) (vgl. Tabelle 13). Die geschätzten R?-Werte als Maße 
für die Reliabilitäts-Schätzungen der manifesten Indikatoren (Geiser, 2011) liegen 
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für den ersten Messzeitpunkt im Bereich .28 < R? < .58 (p < .001) und für den 
zweiten Messzeitpunkt im Bereich .45 < R? <.76 (p < .001). 


Tabelle 13: Faktorladungen (A) und Reliabilitäts-Schätzungen (R?) der Indikatoren 
im Latent-State-Modell der Feedbackqualität 


MZP1 MZP2 
Skala/Item x R2 x R? 
Eirgebnisorientierte Dimension 
fbev3 .66 43 82 .68 
fbev4 .67 45 81 .65 
fbev6 .73 .54 75 56 
fbpol .68 .46 75 56 
Prozessorientierte Dimension 
fbpo5 .61 .37 .67 .45 
fbpo6 .76 58 81 .66 
fbpo7 71 51 .80 .64 
fbpo9 .70 .49 .70 .49 
Selbstregnlationsorientierte Dimension 
fbse4 .53 „28 .68 46 
fbse6 2 52 Si .59 
fbse8 .60 .36 .70 .49 
fbse9 .74 .55 .74 ‚55 
Dialogorientierte Dimension 
fbdil .65 42 72 52 
fbdi3 72 52 77 59 
fbdi4 .64 42 .70 ‚50 
fbdi6 15 56 87 .76 


Anmerkungen. Alle Angaben sind auf einem Niveau von p < .001 signifikant. 


Die Korrelationen zwischen den State-Faktoren untereinander fallen durchschnitt- 
lich bis hoch aus, was auf eine vergleichsweise hohe zeitliche Stabilität interindivi- 
dueller Unterschiede hinsichtlich der wahrgenommenen Feedbackqualität schließen 
lässt (Geiser, 2011): Ergebnisorientierte Dimension: 712 = .71, p < .001; prozessori- 
entierte Dimension: 712 = .64, p < .001; selbstregulationsorientierte Dimension: 712 
= .65, p < .001; dialogorientierte Dimension: 712 = .59, p <.001 (vgl. Tabelle 14). 
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Tabelle 14: Latente Faktor-Interkorrelationen der Dimensionen der Feedbackqua- 
litat im Latent-State-Modell 


Latente Variable oO eo © a © © 0 ® 
(1) EO ty 1.00 71 83 59 69 54 59 53 
(2) EO ty 100 64 84 58 78 44 62 
(3) PO ti 100 64 83 61 63 52 
(4) PO ty 100 61 83 48 67 
(5) SO ti 1.00 65 64 50 
(6) SO ts 1.00 46 64 
(7) DO ti 1.00.59 
(8) DO tz 1.00 


Anmerkungen. EO = ergebnisorientierte Dimension; PO = prozessorientierte Dimension; 
SO = selbstregulationsorientierte Dimension; DO = dialogorientierte Dimension. Darge- 
stellt sind standardisierte Korrelationen; alle Korrelationen sind auf einem Niveau von 
p < .001 signifikant. 


Langsschnitthches Parcel-Strukturmodell 


Das LS-Modell weist eine hohe Komplexität auf und enthält eine große Anzahl an 
zu schätzenden Parametern. Mit Blick auf die noch geplanten Analysen, in denen 
das Modell um Prädiktoren erweitert wird, empfiehlt es sich ein sparsameres Modell 
zu entwickeln. Um Modellsparsamkeit zu erreichen, wurde die Methode des Item- 
Parceling gewählt (vgl. auch Abschnitt 6.6.3). Mit dem Isem-Parceling ist es möglich, 
die Anzahl der Parameter zu reduzieren und trotzdem stabile Parameterschätzun- 
gen zu erreichen (Little et al., 2002; Little et al., 2013). Um die I/em-Parcels zu ermit- 
teln, wurde der balancing approach gewählt, bei dem sich die Auswahl der Item-Paare 
an der Höhe der Faktorladungen orientiert. Die jeweils acht Items der Dimensionen 
der Feedbackqualität zu Beginn und zur Mitte des Schuljahres wurden nach den 
Prinzipien des balancing approach in je zwei Paare aufgeteilt, die aus dem Mittelwert 
der Einzelitems gebildet werden. Aus der Tabelle 15 geht die Zuordnung der Items 
zu den Parcels hervor. Die dargestellten Faktorladungen beziehen sich auf das oben 
beschriebene LS-Modell ohne Item-Parcels. Es ist zu erkennen, dass das erste Item- 
Paar aus dem Item mit der höchsten Faktorladung und dem Item mit der geringsten 
Faktorladung besteht. Das zweite Item-Paar setzt sich zusammen aus den Items mit 
der zweithöchsten und der zweitniedrigsten Ladung. 
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Tabelle 15: Übersicht der Item-Parcels mit den jeweiligen Items und Faktorladun- 
gen (A) zu Beginn (tı) und zur Mitte (t2) des Schuljahres 


Skala/Parcelnr. Parcel Itemkürzel 


Eirgebnisorientierte Dimension zu Beginn des Schuljahres t 


1 p11 afbev3 + afbev6 
2 p21 afbev4 + afbpol 
Eirgebnisorientierte Dimension zur Mitte des Schuljahres tz 

1 p12 bfbev3 + bfbev6 
2 p22 bfbev4 + bfbpol 
Prozessorientierte Dimension zu Beginn des Schuljahres ty 

3 p31 afbpo5 + afbpo6 
4 p41 afbpo7 + afbpo9 
Prozessorientierte Dimension zur Mitte des Schuljahres tz 

3 p32 bfbpo5 + bfbpo6 
4 p42 bfbpo7 + bfbpo9 
Selbstregnlationsorientierte Dimension zu Beginn des Schuljahres ty 

5 p51 afbse4 + afbse9 

6 pol afbse6 + afbse8 

Selbstregnlationsorientierte Dimension zur Mitte des Schuljahres tz 

5 p52 bfbse4 + bfbse9 
6 p62 bfbse6 + bfbse8 
Dialogorientierte Dimension zu Beginn des Schuljahres ty 

7 p71 afbdi1 + afbdi3 

8 p81 afbdi4 + afbdi6 

Dialogorientierte Dimension zur Mitte des Schuljahres tz 

7 p72 bfbdil + bfbdi3 

8 p82 bfbdi4 + bfbdi6 


In Abbildung 14 ist das längsschnittliche 4-Faktormodell der Feedbackqualitat mit 
den Item-Parcels als manifeste Indikatoren der vier Feedbackdimensionen schema- 
tisch dargestellt. Wie im LS-Modell im vorherigen Abschnitt wurden auch hier Re- 
sidualkorrelationen zwischen den gleichen Parcels über die Zeit zugelassen. Das Mo- 
dell weist eine sehr gute Modellpassung auf (y2= 75.96, df= 68, p (XA = .24, CFI = 
1.00, TLI = 1.00, RMSEA [90% CI] = .01 [.00, .03], Cri = 1.00, SRMR = .02). Die 
Faktorladungen in diesem Modell sind alle signifikant und liegen im Bereich X = .72 
und à = .83 (vgl. Tabelle 16). Die Reliabilitäten der Indikatoren liegen über .51. 
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Abbildung 14: Schematische Darstellung des Latent-State-Modells mit Item-Parcels 


Anmerkungen. Die Residualterme werden der besseren Ubersichtlichkeit halber nur durch 
Pfeile dargestellt. Korrelationen zwischen den gleichen Konstrukten benachbarter Messzeit- 
punkte sind nicht dargestellt. Residualkorrelationen sind nicht dargestellt. 
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Tabelle 16: Faktorladungen (A) und Reliabilitats-Schatzungen (R?) der Indikatoren 
im Latent-State-Modell mit Item-Parcels 


Skala/Parcel r R? 
Eirgebnisorientierte Dimension tı 

p11 .76 .60 
p21 .74 .70 
Eirgebnisorientierte Dimension to 

p12 .84 .55 
p22 .82 .67 
Prozessorientiere Dimension tı 

p31 12 51 
p41 82 62 
Prozessorientierte Dimension tz 

p32 .79 .66 
p42 .82 .67 
Selbstregulationsorientierte Dimension tı 

p51 .75 .56 
pol .76 .67 
Selbstregnlationsorientierte Dimension tz 

p52 .82 .58 
p62 .83 .69 
Dialogorientierte Dimension t 

p71 TI .59 
p81 .74 .68 
Dialogorientierte Dimension to 

p72 82 .54 
p82 .77 .60 


Anmerkungen. Alle Angaben sind auf einem Niveau von p < .001 signifikant. 


Tabelle 17 zeigt die Korrelationen zwischen den latenten Feedback-Faktoren im 
LS-Modell mit der Parceling-Methode. Die Korrelationen zwischen den State-Fakto- 
ren über die Zeit sind vergleichbar mit den Korrelationen im LS-Modell ohne Izem- 
Parcels: Ergebnisorientierte Dimension: 712 = .69, p < .001; prozessorientierte Di- 
mension: 712 = .63, p < .001; selbstregulationsorientierte Dimension: ru2 = .62, p < 
.001; dialogorientierte Dimension: 712 = .59, p <.001. Insgesamt ist die Modellpas- 
sung des LS-Modells mit I#m-Parcels als gut zu bewerten, bei gleichzeitiger Mo- 
dellsparsamkeit. Das Parce/-Modell wird daher als Basismodell für die nachfolgen- 
den Messinvarianzanalysen über die Zeit und weitergehenden Modellierungen im 
Längsschnitt herangezogen. 
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Tabelle 17: Latente Faktor-Interkorrelationen der Dimensionen der Feedbackqua- 
lität im Latent-State-Modell mit Item-Parcels 


Latente Variable HO oo © a © © 0 ® 
(1) EO ty 100 69 81 57 66 49 60 53 
(2) EO tp 100 61 82 55 73 43 62 
(3) PO ti 1.00 63 80 56 63 50 
(4) PO tp 100 57 80 47 66 
(5) SO ti 100 62 62 47 
(6) SO ts 1.00 43 63 
(7) DO ti 1.00.59 
(8) DO t2 1.00 


Anmerkungen. Dargestellt sind die standardisierten Korrelationskoeffizienten; EO = ergeb- 
nisorientierte Dimension; PO = prozessorientierte Dimension; SO = selbstregulationsori- 
entierte Dimension; DO = dialogorientierte Dimension; alle Korrelationen sind auf einem 
Niveau von p < .001 signifikant. 


7.2 Messinvarianz der Feedbackqualität 


Im folgenden Abschnitt wird auf die weiteren Ergebnisse zur ersten Forschungs- 
frage eingegangen, in der untersucht werden soll, ob das Instrument zur Erfassung 
von Feedback messinvariant über die Zeit (Teiffragestellung FTb) und die Geschlech- 
tergruppen (Teffragestellung FT) ist. 


7.2.1 Messinvarianz über die Zeit 


Voraussetzung für die Durchführung der Analysen zu den längsschnittlichen Fra- 
gestellungen ist die Prüfung der Frage, ob die Messungen der Konstrukte über die 
Zeit hinreichend vergleichbar sind. Hierzu wurde das längsschnittliche 4-Faktor- 
Parcel-Modell durch unterschiedliche Gleichheitsrestriktionen auf die verschiede- 
nen Ebenen der Messinvarianz hin geprüft. Die Ergebnisse der Invarianzprüfungen 
sind Tabelle 18 (Modell-Fit-Indizes) und Tabelle 19 (Modellvergleiche) zu entneh- 
men. 

Das Basismodell (Modell I), in dem die Gleichheit der Faktorenstruktur über 
die Zeit spezifiziert wird, wurde in Abschnitt 7.1.3 beschrieben. Es erfüllt die Vo- 
raussetzungen konfiguraler Invarianz. Im Modell schwacher faktorieller Invarianz 
wurden die Faktorladungen über die Zeit gleichgesetzt (Modell ID). Für das Modell 
liegen sehr gute Fit-Werte vor (y?= 78.06, df= 72, p(y?) = .29, CFI = 1.00, TLI = 
1.00, RMSEA = .01, SRMR = .02). Der Vergleich dieses restringierten Modells mit 
dem Basismodell (Modell I) mittels des korrigierten y?-Differenztests zeigt keinen 
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signifikanten Unterschied (Ay?kor = 1.58, Adf= 4, p = .81). Die CFI-Differenz von 
-.001 liegt unter der von Cheung & Rensvold (2002) beschriebenen Grenze von .01. 
Damit ist keine empirisch bedeutsame Abweichung vom Basismodell zu verzeich- 
nen, weshalb das Modell schwacher faktorieller Invarianz beibehalten werden kann. 


Tabelle 18: Modell-Fit-Indizes des 4-Faktor-Parcel-Modells der Feedbackqualitat 
mit unterschiedlichem Grad der Messinvarianz 


Modell 2 df es RMSEA [90% CI] CFit SRMR CFI TLI 


I 75.96 68  .24 .01 [.00, .03] 1.00 02 1.00 1.00 
I 78.06 72 .29 .01 [.00, .02] 1.00 02 1.00 1.00 
II 91.43 76 11 .02 [.00, .03] 1.00 .02 1.00 1.00 


Anmerkungen. I = Basismodell konfiguraler Messinvarianz, II = Modell schwacher faktoriel- 
ler Messinvarianz, III = Modell starker faktorieller Messinvarianz. 


Tabelle 19: Ergebnisse der Modellvergleiche 


Modellvergleich AY? kort Adf p ACFI 
II vs. I 1.58 4 81 -.001 
II vs. I 16.22 8 .04 -.002 
III vs. I 13.58 4 .01 -.001 


Anmerkungen. I = Basismodell konfiguraler Messinvarianz, II = Modell schwacher faktoriel- 
ler Messinvarianz, III = Modell starker faktorieller Messinvarianz. 


Im darauffolgenden Modell starker faktorieller Messinvarianz (Modell ID) wurde 
geprüft, ob zusätzlich zur Faktorstruktur und zu Faktorladungen auch die Inter- 
cepts über die Messzeitpunkte identisch sind. Die Modell-Fit-Statistiken weisen auf 
eine gute Passung an die Daten hin (x? = 91.43, df= 76, p(y?) = .11, CFI = 1.00, 
TLI = 1.00, RMSEA = .02, SRMR = .02). Der Vergleich des restringierten Modells 
mit dem Basismodell mittels des korrigierten y?-Differenztests legt nahe, das Modell 
zu Gunsten des Basismodells zu verwerfen (Ay*korr = 16.22, Adf= 8, p = .04). 
Auch der Vergleich mit dem Modell schwacher faktorieller Invarianz deutet auf 
eine signifikante Modellverschlechterung durch das Gleichsetzen der Intercepts hin 
(Ay’kor = 13.58, Adf = 4, p = .01). Aufgrund der Stichprobensensitivitat des y?- 
Differenztests wird zusätzlich der CFI-Differenztest herangezogen. Die Differenz 
von -.002 (Modell II vs. I) bzw. -.001 (Modell II vs. I) liegt unter dem Cutoff-Wert 
von ACFI = .01. Damit muss das Modell starker faktorieller Messinvarianz nicht 
verworfen werden, sodass Mittelwertvergleiche über die Zeit zulässig sind. 


118 Ergebnisse 


7.2.2  Messinvarianz über die Geschlechtergruppen 


Um zu untersuchen, inwiefern sich die Mittelwerte in der Wahrnehmung der Feed- 
backdimensionen zwischen Schülerinnen und Schülern unterscheiden, muss zu- 
nächst geprüft werden, ob sich die Struktur des Konstrukts der wahrgenommenen 
Feedbackqualität für beide Gruppen abbilden lässt. Nur unter dieser Bedingung ist 
es zulässig, Mittelwerte zwischen den Gruppen zu vergleichen. Dies wurde durch 
die nachfolgende Prüfung auf Messinvarianz anhand eines multiplen Gruppenver- 
gleichs im Rahmen von CFAs geklärt. Die Ergebnisse der Invarianzprüfung sind in 
Tabelle 20 (Fit-Indizes) und Tabelle 21 (Modellvergleiche) dargestellt. 


Tabelle 20: Ergebnisse der Prüfung auf Messinvarianz der Feedbackqualität nach 
Geschlecht 


Modell X df po RMSEA [90% CH Cr SRMR CFI TLI 


I weiblich = 68 .67 .00 [.00, .02] 1.16 .02 1.00 1.00 

I männlich u 68 .04 .03 [.01, .04] .99 .03 .99 .98 

I = 136 .16 .02 [.00, .03] 1.00 .02 1.00 99 

II = 144.09 .02 [.00, .03] 1.00 .04 1.00 99 

IV = 152.05 .02 [.00, .03] 1.00 .04 99 99 
Anmerkungen. I weiblich = Basismodell weibliche Stichprobe, I männlich = Basismodell 
männliche Stichprobe, II = Basismodell konfiguraler Messinvarianz, III = Modell schwa- 


cher faktorieller Messinvarianz, IV = Modell starker faktorieller Messinvarianz. 


Tabelle 21: Ergebnisse der Modellvergleiche 


Modellvergleich AX korr Adf p ACFI 
III vs. Il 15.71 8 .05 -.002 
IV vs. II 30.91 16 01 -.003 
IV vs. IH 15.18 8 .05 -.001 


Anmerkungen. II = Basismodell konfiguraler Messinvarianz, III = Modell schwacher faktori- 
eller Messinvarianz, IV = Modell starker faktorieller Messinvarianz. 


Im ersten Schritt wurde das Strukturmodell in beiden Gruppen separat überprüft 
(Modell I). Die Modell-Fit-Werte der CFAs sind gut bis sehr gut, sodass im nächs- 
ten Schritt das Baseline-Modell (Modell IT) — in dem alle Parameter frei variieren 
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dürfen — im Rahmen eines multiplen Gruppenvergleichs für beide Gruppen simul- 
tan geschätzt werden kann. Die Fit-Werte können auch hier als gut bewertet werden 
und bestätigen damit die Annahme von konfiguraler Messinvarianz, d.h. der Gleich- 
heit der Faktorstruktur. Anschließend wurden zur Überprüfung eines Modells 
schwacher faktorieller Invarianz die Faktorladungen in den beiden Gruppen gleich- 
gesetzt (Modell IIT). Der Modell-Fit dieses restringierten Modells ist sehr gut, aller- 
dings fällt der y?-Differenztests signifikant aus (Ay?kor = 15.71, Adf = 8, p = .05). 
Daher wird zusätzlich der CFI-Differenztest zum Modellvergleich herangezogen. 
Der CFI-Wert liegt mit -.002 unter der vorgegebenen Cutoff-Grenze, sodass schwa- 
che faktorielle Messinvarianz angenommen werden kann. Um die Mittelwerte zwi- 
schen den Gruppen vergleichen zu können, muss starke faktorielle Messinvarianz 
vorliegen. Hierzu wurde das Modell IV spezifiziert, in dem zusätzlich zur Fak- 
torstruktur und den Faktorladungen auch die Intercepts der manifesten Indikatoren 
in den beiden Gruppen gleich sind. Der Modell-Fit ist sehr gut. Allerdings zeigt der 
Vergleich mit dem Baseline-Modell und dem Modell schwacher faktorieller Invari- 
anz mittels des korrigierten y?-Differenztests eine (tendenziell) bedeutsame Ver- 
schlechterung (Modell IV vs. Modell II: Ay?kor = 30.91, Adf= 8, p = .01; Modell IV 
vs. Modell III: Axor = 15.18, Adf = 8, p = .05). Da der CFI-Differenzwert unter 
der Cutoff-Grenze liegt (ACFI = -.003 bzw. -.001), wird das Modell schwacher fak- 
torieller bzw. starker faktorieller Invarianz nicht verworfen. 


Geschlechtsspezifische Unterschiede in der wahrgenommenen Feedbackqualität 


Nachdem die Messäquivalenz in den Dimensionen der Feedbackqualität zwischen 
den Gruppen (Schülerinnen und Schüler) nachgewiesen werden konnte, können 
schließlich die Ergebnisse des multiplen Gruppenvergleichs betrachtet werden und 
damit ein Teil der Hauptforschungsfrage 1 zur differenziellen Feedbackwahrneh- 
mung in Abhängigkeit des Geschlechts beantwortet werden. Die Ergebnisse hierzu 
sind in Tabelle 22 dargestellt. 

Die Referenzgruppe ist dabei die Gruppe der Schüler. Unterschiede werden mit- 
tels latent geschätzter, standardisierter Mittelwertdifferenzen in Skalenpunkten an- 
geben. Der Gruppenvergleich zeigt, dass zu beiden Messzeitpunkten keine signifi- 
kanten geschlechtsspezifischen Unterschiede hinsichtlich der Wahrnehmung der 
Dimensionen der Feedbackqualität vorliegen. Schülerinnen und Schüler unterschei- 
den sich demnach nicht bedeutsam in ihrer Wahrnehmung von Feedback. 
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Tabelle 22: Geschlechtsspezifische latente Mittelwertdifferenzen in der Feedback- 
wahrnehmung zu Beginn und zur Mitte des Schuljahres (MZP 1/MZP 2) 


Skala MZP MW SE p 

EO 1 0.07 0.11 .53 
EO 2 0.05 0.11 .66 
PO 0.04 0.09 .66 
PO 2 0.08 0.10 44 
SO 1 -0.11 0.07 11 
so 2 -0.12 0.10 21 
DO 1 -0.12 0.09 16 
DO 2 0.01 0.13 94 


Anmerkungen. Referenzgruppe: männlich; » (Schülerinnen) = 429, n (Schüler) = 348; EO = 
ergebnisorientierte Dimension; PO = prozessorientierte Dimension; SO = selbstregulation- 
sorientierte Dimension; DO = dialogorientierte Dimension. 


7.3 Differenzielle Veränderung der 
Feedbackwahrnehmung 


Der nachfolgende Abschnitt widmet sich der Frage nach der Veränderung der 
Feedbackwahrnehmung im Verlauf eines Schulhalbjahres (Tez/fragestellung F1d) und 
der Vorhersage von interindividuellen Unterschieden im Ausgangsniveau und in der 
Veränderung der Feedbackwahrnehmung in Abhängigkeit des Geschlechts (Ted/fra- 
gestellung Fe). Hierzu werden zunächst die auf Basis des langsschnittlichen Latent- 
State-Modells geschätzten latenten Mittelwerte zu Beginn und zur Mitte des Schul- 
jahres betrachtet (Abschnitt 7.3.1) und anschließend die latenten Veränderungen im 
Latent-True-Change-Modell (Abschnitt 7.3.2). 


7.3.1 Deskriptive Entwicklungen 


Um einen ersten Überblick über die Mittelwertveränderungen in den Feedbackdi- 
mensionen über die Zeit zu erhalten, werden die geschätzten latenten Mittelwerte 
der Dimensionen der Feedbackqualität zu Beginn und zur Mitte des Schuljahres 
und die Mittelwertdifferenzen über die beiden Messzeitpunkte betrachtet (vgl. Ta- 
belle 23). 
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Tabelle 23: Latente Faktormittelwerte (MW), -varianzen (Var) der Dimensionen 
der Feedbackqualität im Latent-State-Modell sowie Mittelwertdifferenzen 


MZP1 MZP2 
Latente Variable MW (SE) Var (SE) MW (SE) Var (SE) AMW 
(1) EO 3.09 (0.05) 0.22 (0.03) 2.99 (0.04) 0.26 (0.02) -0.10*** 
(2) PO 2.95 (0.04) 0.25 (0.02) 2.99 (0.05) 0.27 (0.03) 0.05 
(3) SO 2.91 (0.03) 0.20 (0.02) 2.96 (0.04) 0.27 (0.03) 0.06 
(4) DO 2.94 (0.04) 0.25 (0.02) 3.05 (0.05) 0.29 (0.03) 0.10% ** 


Anmerkungen. EO = ergebnisorientierte Dimension; PO = prozessorientierte Dimension, 
SO = selbstregulationsorientierte Dimension; DO = dialogorientierte Dimension. **p < .01, 
eH < O01. 


Es ist erkennbar, dass die latenten mittleren Auspragungen in den Dimensionen der 
Feedbackqualität zu Beginn des Schuljahres über dem theoretischen Mittelwert von 
2.5 liegen. Die Ausprägung in der ergebnisorientierten Dimension ist etwas höher 
als in den anderen drei Dimensionen?, während die Ausprägung in der selbstregu- 
lationsorientierten Dimension zu MZP 1 am geringsten ausfällt’. Zur Mitte des 
Schuljahres liegen die mittleren Ausprägungen in den Dimensionen der Feed- 
backqualität weiterhin über dem theoretischen Mittelwert. Zur Mitte des Schuljah- 
res ist die Ausprägung in der dialogorientierten Dimension etwas höher als in den 
anderen Dimensionen*, während die Wahrnehmung der selbstregulationsorientier- 
ten Dimension weiterhin am geringsten ausgeprägt ist.” Anhand der Mittelwerte in 


2 Ein Modellvergleich mit sukzessiver Gleichsetzung der Mittelwerte lässt darauf schließen, dass sich 
die zu MZP 1 geschätzte mittlere Ausprägung in der ergebnisorientierten Dimension statistisch sig- 
nifikant von der Ausprägung in der prozessorientierten Dimension (Aykorr = 33.43, Adf = 1, 

p <.001), der selbstregulationsorientierten Dimension (Ay2korr = 33.95, Adf = 1, p <.001) und der 
dialogorientierten Dimension (Ay?korr = 33.95, Adf= 1, p <.001) unterscheidet. 

3 Auch hier ergibt ein Modellvergleich mit sukzessiver Gleichsetzung der Mittelwerte der selbstregu- 
lationsorientierten Dimension und einer anderen Feedback-Dimension, dass sich die zu MZP 1 ge- 
schätzte mittlere Ausprägung in der selbstregulationsorientierten Dimension statistisch signifikant 
von der Ausprägung in der ergebnisorientierten Dimension (Ay?kor = 33.95, Adf= 1, p <.001) und 
der prozessorientierten Dimension (Ay2kor = 4.39, Adf = 1, p = .04) unterscheidet. Lediglich die 
Gleichsetzung der Mittelwerte in der selbstregulationsorientierten Dimension und dialogorientierten 
Dimension führt nicht zu einer signifikanten Modellverschlechterung (Axor = 2.29, Adf= 1, 

p = -13), was darauf schließen lässt, dass sich die Mittelwerte in diesen Dimensionen der Feed- 
backqualität nicht bedeutsam unterscheiden. 

4 Ein Modellvergleich zeigt, dass lediglich die Gleichsetzung der zu MZP 2 geschätzten Mittelwerte 
in der dialogorientierten Dimension und der selbstregulationsorientierten Dimension zu einer signifi- 
kanten Modellverschlechterung führt (Ayo = 10.65, Adf = 1, p = .001), was auf einen bedeutsamen 
Mittelwertunterschied zuMZP 2 schließen lässt. 

5 Ein Modellvergleich mit sukzessiver Gleichsetzung der Mittelwerte zeigt, dass sich lediglich die 
Mittelwerte zwischen der selbstregulationsorientierten Dimension und der dialogorientierten Dimen- 
sion signifikant unterscheiden (s.o.). 
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den Feedbackdimensionen ist erkennbar, dass sich die Wahrnehmungen kaum ver- 
ändert haben. Die mittleren Ausprägungen in der Wahrnehmung der prozessorien- 
tierten (MWa = 2.95, SEa = 0.04, MWe = 2.99, SE = 0.05) und selbstregulation- 
sorientierten (MW = 2.91, SEu = 0.03, MW 2 = 2.96, SE2 = 0.04) Dimension sind 
nahezu konstant geblieben. Lediglich für die ergebnisorientierte Dimension ist eine 
leichte Abnahme (MW = 3.09, SEu = 0.05, MW = 2.99, SE = 0.04) und für die 
dialogorientierte Dimension ein leichter Anstieg (MWa = 2.94, SEu = 0.04, 
MWs= 3.05, SE} = 0.05) in der mittleren Ausprägung zu verzeichnen. Abbildung 
15 zeigt zusammenfassend die deskriptiven Entwicklungen der Feedbackdimensio- 
nen. 
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Abbildung 15: Veränderung der wahrgenommenen Dimensionen von Feedbackqualitat 


Um zu erkennen, ob sich die Mittelwerte in den Feedbackdimensionen zwischen 
den beiden Messzeitpunkten signifikant unterscheiden, wurden im LS-Modell suk- 
zessive die Mittelwerte der vier Feedbackdimensionen über die Zeit gleichgesetzt 
und geprüft, ob diese Restriktionen zu einer Verschlechterung des Modell-Fits im 
Vergleich zum nicht restringierten LS-Modell mit frei geschätzten Mittelwerten füh- 
ren. Eine Verschlechterung des Modell-Fits lässt auf eine bedeutsame Veränderung 
der jeweiligen Dimension der Feedbackqualität schließen (Geiser, 2011; vgl. An- 
wendung in Buff, 2014). Für die ergebnisorientierte Dimension der Feedbackquali- 
tät zeigt sich, dass das Modell mit gleichgesetzten Mittelwerten im Vergleich zum 
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Modell mit frei geschätzten Mittelwerten signifikant schlechter an die Daten passt 
(Ayko = 8.94, Adf = 1, p = .003). Dies lässt auf eine signifikante Abnahme der 
Wahrnehmung der ergebnisorientierten Feedbackdimension schließen. Allerdings 
ist der absolute Fit des restriktiveren Modells immer noch als sehr gut zu bewerten 
= 112.81, df= 77, p(y?) = .005, CFI = .99, TLI = .99, RMSEA [90% CI] = .02 
[.01, .03], Cri = 1.00, SRMR = .02), was darauf hindeutet, dass die Mittelwertunter- 
schiede als eher gering einzustufen sind. Fur die prozessorientierte Dimension weist 
der korrigierte y?-Differenztest auf eine nicht signifikante Verschlechterung des 
Modell-Fits hin (Ay?korr = 2.06, Adf = 1, p = .15). Dies deutet darauf hin, dass sich 
die Wahrnehmung der prozessorientierten Dimension nicht bedeutsam verändert. 
Auch die Gleichsetzung der Mittelwerte der selbstregulationsorientierten Dimen- 
sion führt nicht zu einer signifikanten Modellverschlechterung (A% kor = 3.53, 
Adf= 1, p = .06), d.h. auch die Wahrnehmung der selbstregulationsorientierten Di- 
mension verändert sich nicht bedeutsam. Für die dialogorientierte Dimension wie- 
derrum verweist der y?-Differenztest auf eine signifikante Verschlechterung des 
Modell-Fits (Ay&kor = 16.21, Adf= 1, p < .001) und somit auf eine signifikante Zu- 
nahme der Wahrnehmung der dialogorientierten Dimension zum 2. Messzeitpunkt. 
Allerdings ist der absolute Fit des restriktiveren Modells mit gleichgesetzten Mittel- 
werten immer noch als sehr gut zu bewerten (%2 = 107.74, df= 77, p(y’) = .01, 
CFI = .99, TLI = .99, RMSEA [90% CI] = .02 [.01, .03], Cri = 1.00, SRMR = .03). 
Die geschatzten latenten Faktorvarianzen fallen fiir alle Dimensionen signifikant 
aus (p < .001), d.h. es sind interindividuelle Unterschiede in den Ausprägungen der 
Dimensionen der Feedbackqualitat zu beiden Messzeitpunkten vorhanden. 


7.3.2 Veränderung im Latent-True-Change-Modell 


Um die Veränderung in der Feedbackwahrnehmung über die zwei Messzeitpunkte 
zu modellieren, wurde ein Latent-True-Change-Modell (LTC-Modell) geschätzt. 
Hierzu wurde das im Abschnitt 7.1.3 beschriebene längsschnittliche Parcel-Modell 
zu einem LTC-Modell umgewandelt. Die Modellierung der Veränderung der Feed- 
backqualität erfolgte über die latenten Differenzen der Wahrnehmungsdimensionen 
zwischen den beiden Messzeitpunkten. Für die Annahme starker faktorieller Mess- 
invarianz als Voraussetzung für die Längsschnittanalyse wurden die Faktorladungen 
und Intercepts über die Zeit gleichgesetzt (analog zum LS-Parcel-Modell in Ab- 
schnitt 7.1.3). Das LTC-Modell mit starker faktorieller Messinvarianz ist in Abbil- 
dung 16 dargestellt. 

Der Fit des LTC-Modells mit invarianten Ladungen und Intercepts ist identisch 
zum Fit des LS-Modells mit starker faktorieller Invarianz (vgl. Tabelle 18): 
x? = 91.43, df= 76, p(y?) = .11, CFI = 1.00, TLI = 1.00, RMSEA [90% CI] = .02 
[.00, .03], CFit = 1.00, SRMR = .02. Die Faktorladungen im Modell betragen zwi- 
schen .64 und .81. Die Indikatorreliabilitaten liegen tiber .52 und damit tiber dem 
geforderten Schwellenwert. 
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Abbildung 16: Latent-True-Change-Modell für die Veränderung der Feedbackwahrnehmung über die 
Zeit 


Anmerkungen. A: Strukturmodell. B: Messmodelle mit autokorrelierten Fehlertermen. Dar- 
gestellt sind die standardisierten Parameterschätzungen. Nicht-signifikante Korrelationen 
sind gestrichelt dargestellt. A = Latente Veränderungsvariable. 
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In Tabelle 24 sind die Mittelwerte und Varianzen der latenten Variablen zum ersten 
Messzeitpunkt und der latenten Differenzvariablen dargestellt. Die latenten Diffe- 
renzwerte entsprechen den berichteten Differenzen im längsschnittlichen Struktur- 
modell (vgl. Tabelle 23). Wie schon in Abschnitt 7.3.1 beschrieben, zeigen auch die 
Ergebnisse der LTC-Analyse eine leichte Abnahme in der mittleren Wahrnehmung 
der ergebnisorientierten Dimension vom Beginn des Schuljahres zur Mitte des 
Schuljahres. Diese Veränderung fällt statistisch signifikant aus (MWt, = 3.09, SE = 
0.05, AMWt2-t = -0.10, p < .01). Die mittleren Ausprägungen in der prozessorien- 
tierten Dimension, selbstregulationsorientierten Dimension und dialogorientierten 
Dimension nehmen etwas zu, wobei diese Veränderung nur für die selbstregulati- 
onsorientierte Dimension (MWtı = 2.91, SE = 0.03, AMW2- tı = 0.06, p = .05) und 
dialogorientierte Dimension (MWt, = 2.94, SE = 0.03, AMWtz-tı = 0.10, p < .001) 
statistisch signifikant ausfällt. Allerdings zeigte das LS-Modell, in dem die Mittel- 
werte der State-Faktoren für beide Messzeitpunkte geschätzt wurden, dass die Mit- 
telwertunterschiede über die Zeit — insbesondere in Bezug auf die selbstregulation- 
sorientierte Dimension — als cher gering einzustufen sind. 


Tabelle 24: Mittelwerte (MW) und Varianzen (Var) der latenten Faktoren im La- 
tent-True-Change-Modell 


Latente Variable MW (SE) Var (SE) 


(1) EO t 
(2) AEO ta-tı 
(3) PO ti 
(4) APO tz-t 
(5) SO ti 
(6) ASO t2-tı 
(7) DO ti 
(8) ADO tz-tı 


3.09 (0,05) 
-0.10** (0.03) 
2.95%** (0.04) 
0.05 (0.03) 
2.91%** (0.03) 
0.06* (0.03) 
2.94%** (0.04) 
0.10%** (0.03) 


0.22*** (0.03) 
0.15%** (0.03) 
0.25%** (0.02) 
0.19%** (0.02) 
0.20*** (0.02) 
0.19%** (0.03) 
0.25%** (0.02) 
0.22*** (0.03) 


Anmerkungen. Dargestellt sind die unstandardisierten Parameterschätzungen; EO = ergeb- 
nisorientierte Dimension; PO = prozessorientierte Dimension; SO = selbstregulationsori- 
entierte Dimension; DO = dialogorientierte Dimension; A = Latente Veränderungsvariable. 
*p < .05, **p < .01,***p < .001. 


Tabelle 25 zeigt die Korrelationen der Veränderungsvariablen mit den Ausgangs- 
werten und die Korrelationen zwischen den Veränderungsvariablen im LTC-Mo- 
dell. Die latenten Korrelationen zwischen dem Ausgangswert und dem Verände- 
rungswert innerhalb einer Dimension der Feedbackqualität fallen statistisch bedeut- 
sam aus (Ergebnisdimension/ Selbstregulationsdimension: raz = -.30, p < .001; 
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Prozessdimension/ Dialogdimension: raz = -.37, p < .001). Die negativen Korrela- 
tionskoeffizienten deuten darauf hin, dass ein hoher Ausgangswert mit einer schwä- 
cheren Veränderung in der Wahrnehmung der jeweiligen Dimension bzw. ein ge- 
ringer Ausgangswert mit einer stärkeren Veränderung in der Wahrnehmung einher- 
geht. Das heißt, dass sich Schülerinnen und Schüler mit einer hohen Ausprägung in 
der Wahrnehmung von Feedback zu Beginn des Schulhalbjahres weniger in ihrer 
Wahrnehmung im Verlauf des Schulhalbjahres verändern als Schülerinnen und 
Schüler mit einer anfänglich geringen Feedbackwahrnehmung. Die positiven Kor- 
relationen zwischen den Veränderungsvariablen A ergebnisorientiert t2-ti, A pro- 
zessorientiert t>-tı, A selbstregulationsorientiert t>-tı sowie A dialogorientiert t2-ti 
deuten darauf hin, dass eine Veränderung in einer Dimension der Feedbackqualität 
auch eine Veränderung in einer anderen Dimension zufolge hat. Anders ausge- 
drückt: Die Abnahme bzw. Zunahme in der Wahrnehmung der einen Dimension 
geht mit einer Abnahme bzw. Zunahme der Wahrnehmung in der anderen Dimen- 
sion einher. Die Korrelationen zwischen dem Ausgangswert einer Dimension und 
dem Veränderungswert einer anderen Dimension der Feedbackqualität fallen nur 
schwach (z.B. ergebnisorientiert tı und A prozessorientiert t>-tı: r = -.23, p < .001) 
oder nicht signifikant aus (z.B. ergebnisorientiert tı und A selbstregulationsorien- 
tiert t>-tı: r= -.10, n.s.), was auf einen geringen Zusammenhang hindeutet. 


Tabelle 25: Interkorrelationen der latenten Faktoren im Latent-True-Change-Mo- 
dell 


Latente Variable () @® (3) (4) (5) (6) (7) (8) 


(1) EO ti 1.00 -.30*** .81*** -.23"* 66% -10 .60%** -02 
(2) AEO ta-tı 1.00 -16* .65*** -07 .52*** -_,15*  ,367** 
(3) PO ti 1.00  -.37*** .80"** — -.16** .63*** -09 
(4) APO tz-t1 1.00 -.22* = .62***  -.15** = .42*** 
(5) SO tı 1.00 -.30*** .62*** — -.11* 
(6) ASO tz-tı 1.00 -.114*  .45¥** 
(7) DO ti 1.00 -.37*** 
(8) ADO tz-t 1.00 


Anmerkungen. EO = ergebnisorientierte Dimension; PO = prozessorientierte Dimension; 
SO = selbstregulationsorientierte Dimension; DO = dialogorientierte Dimension; darge- 
stellt sind standardisierte Korrelationen; A = Latente Veränderungsvariable; alle Korrelati- 
onen sind auf einem Niveau von p < .001 signifikant. 
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7.3.3 Effekte auf die Veränderung der Feedbackwahrnehmung 


In diesem Abschnitt erfolgt die Prüfung der Hypothese, in der davon ausgegangen 
wird, dass das Geschlecht und die Deutschnote der Schülerinnen und Schüler prä- 
diktiv für interindividuelle Unterschiede in der intraindividuellen Veränderung der 
Wahrnehmung von Feedback sind (Teiffragestellung FTe). Hierzu wurde ein Struk- 
turgleichungsmodell spezifiziert, in dem direkte Effekte der Hintergrundvariablen 
auf die Veränderungen der Feedbackdimensionen (unter Kontrolle der Ausgangs- 
wahrnehmung zu Messzeitpunkt 1) modelliert wurden. Korrelationen zwischen den 
unabhängigen Variablen wurden zugelassen. Das so spezifizierte Modell weist eine 
sehr gute Datenanpassung auf (y? = 113.50, df= 92, p(y?)= .06, CFI = 1.00, TLI = 
‚99, RMSEA [90% CI] = .02 [.00, .03], Cri = 1.00, SRMR = .02). Der y?-Test fällt 
nicht signifikant aus und auch die anderen Fit-Indizes weisen auf einen sehr gut 
Modell-Fit hin. 

Die Ergebnisse der Strukturgleichungsanalysen sind in Tabelle 26 (standardi- 
sierte Regressionskoeffizienten) und Tabelle 27 (unstandardisierte Regressionsko- 
effizienten) dargestellt. Die Ergebnisse zeigen signifikante Zusammenhänge des 
Geschlechts und der Deutschnote mit den Feedbackdimensionen zu Beginn des 
Schuljahres: Die Deutschleistung hängt positiv mit der Wahrnehmung des ergeb- 
nisorientierten Feedbacks (B = .14, SE = 0.05, p = .01), des prozessorientierten 
Feedbacks (B = .17, SE = 0.05, p = .001), des selbstregulationsorientierten Feed- 
backs (ß = .18, SE = 0.05, p < .001) und des dialogorientierten Feedbacks (B = .14, 
SE = 0.05, p = .01) zusammen. Demzufolge geht eine bessere Leistung mit einer 
positiveren Wahrnehmung der Feedbackqualitat einher. Unter Kontrolle der Vor- 
leistung wird auch der Einfluss des Geschlechts auf die Wahrnehmung des selbst- 
regulationsorientierten Feedbacks (B = -.09, SE = 0.04, p = .02) und des dialogori- 
entierten Feedbacks (B = -.10, SE = 0.04, p = .03) signifikant: Bei gleicher 
Deutschnote nehmen Schülerinnen die Ausprägung des selbstregulationsorientier- 
ten und dialogorientierten Feedbacks geringer wahr als Schüler. Die Modelle erklä- 
ren allerdings lediglich einen geringen Anteil der Varianz in der Wahrnehmung des 
selbstregulationsorientierten Feedbacks (R? = .03, p = .05) und des dialogorientier- 
ten Feedbacks (R? = .02, p = .12) zu Beginn des Schuljahres. 

Entgegen den Erwartungen können in diesem Modell keine statistisch signifi- 
kanten Effekte der Hintergrundmerkmale auf die Veränderung der Feedbackwahr- 
nehmung im Schulhalbjahr nachgewiesen werden — weder für das Geschlecht (.01 
<ß<.09,n. s.) noch die Deutschnote der Schülerinnen und Schüler (- .09 < B < - 
.05,.n. s.). 
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Tabelle 26: Standardisierte Regressionskoeffizienten in den Latent-True-Change- 
Modellen mit Geschlecht und Deutschnote als Prädiktoren der Wahrnehmungs- 
veränderung von Feedback 


Selbstregula- 


Ergebnis Prozess ; 
ton 


Dialog 


Level Change Level Change Level Change Level Change 


Prä- z : 

diktoren i B (SE) ie B (SE) u B (SE) an B (SE) 

Ge- 00 01 -02 o4 o 0 -10 0 

schlecht (0.06) (0.05) (0.05) (0.06) (0.04 (0.06) (0.04) (0.06) 

en 14% 00 Te 00 05 14% -.07 
(0.05) (0.06) (0.05) (0.05) (0.05) (0.07) (0.05) (0.07) 

R? o2 ol 03 oa 03 0 02 © O1 


Anmerkungen. Ergebnis = Ergebnisorientierte Dimension der Feedbackqualität; Prozess = 
Prozessorientierte Dimension der Feedbackqualität; Selbstregulation = Selbstregulationso- 
rientierte Dimension der Feedbackqualität; Dialog = Dialogorientierte Dimension der Feed- 
backqualität; das Geschlecht (1 = weiblich) ist eine dichotomisierte Variable; die 
Deutschnote wurde rekodiert (hohe Werte entsprechen einer guten Note). *p < .05; **p < 
.01; ***p < .001. 


Tabelle 27: Unstandardisierte Regressionskoeffizienten in den Latent-True- 
Change-Modellen mit Geschlecht und Deutschnote als Prädiktoren der Wahrneh- 
mungsveränderung von Feedback 


Selbstregula- 


Ergebnis Prozess i 
ton 


Dialog 


Level Change Level (Change Level Change Level Change 
Prä- B B 
diktoren (SHE) en (SE) 


Ge- 00 01 -02 04 -09 00 -.10* 08 
schlecht (0.06) (0.09 (0.05) (0.05) (0.03) (0.05) (0.05) (0.06) 


B(SE) BSE) BGE B(SE B(BH 


T 07x O 04 09%% -04 09 02 08 -03 
(0.03) (0.02) (0.03) (0.03) (0.03) (0.03) (0.03) (0.03) 
R? 02 01 03 01 03 00 02 01 


Anmerkungen. Ergebnis = Ergebnisorientierte Dimension der Feedbackqualität; Prozess = 
Prozessorientierte Dimension der Feedbackqualität; Selbstregulation = Selbstregulationso- 
rientierte Dimension der Feedbackqualität; Dialog = Dialogorientierte Dimension der Feed- 
backqualitat; das Geschlecht (1 = weiblich) ist eine dichotomisierte Variable; die 
Deutschnote wurde rekodiert (hohe Werte entsprechen einer guten Note). *p < .05; **p < 
.01; ***p < .001. 
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7.4 Zusammenhänge zwischen Feedback und 
Lernmotivation 


Im Folgenden werden die reziproken Zusammenhänge zwischen den Dimensionen 
von wahrgenommener Feedbackqualität und der intrinsischen Lernmotivation so- 
wie ihren Veränderungsvariablen betrachtet (Hanpfforschungsfrage II). Hier wird die 
Skala zur Erfassung der intrinsischen Lernmotivation zunächst einer faktorenana- 
lytischen Prüfung zu beiden Messzeitpunkten separat sowie im Längsschnitt unter- 
zogen. Dabei werden auch die deskriptiven Befunde sowie die Ergebnisse zu den 
Messinvarianzanalysen berichtet. Im Anschluss daran wird das Latent-True- 
Change-Modell zur Modellierung der Veränderung der intrinsischen Motivation 
spezifiziert. 


7.4.1 Faktorenstruktur und deskriptive Statistik der Skala Lernmotivation 


Im Rahmen einer konfirmatorischen Faktorenanalyse wurde die Eindimensionalität 
der Skala zur Erfassung der intrinsischen Lernmotivation zu Beginn und zur Mitte 
des Schuljahres geprüft. Die Modellgütekriterien sind Tabelle 28 zu entnehmen. Der 
Modell-Fit fällt im Hinblick auf den CFI, TLI und SRMR gut aus, da die gängigen 
Cut-Off-Werte nicht überschritten werden. Der y?-Test, der Quotient aus y?/dfund 
der RMSEA weisen hingegen auf eine nicht akzeptable Modellpassung hin. Die Mo- 
dellierung einer Residualkorrelation (Kline, 2016) zwischen den Items 1 und 2 (auf- 
grund der benachbarten Platzierung im Fragebogen) führt zu einer substanziellen 
Verbesserung des Modell-Fits zu MZP 1. 


Tabelle 28: Ergebnisse der konfirmatorischen Faktorenanalyse zur intrinsischen 
Lernmotivation zu Beginn und zur Mitte des Schuljahres (MZP 1 und MZP 2) 


RMSEA 
7 2 2 : 
Modell MZP X F LIF oe Cm CFI TU SRMR 
.10 
* 
IM 1 90.04* 9 10.00 1.09, 13] 00 1.00 .99 02 
IM 07 
(mit Metho- 1 39.48* 8 4.94 05 09 06 1.00 1.00 01 
denfaktor) [93303] 
.10 
ok 
IM 2 71.50% 9 7.94 [.08, 13] 00 1.00 1.00 02 
IM 10 
(mit Metho- 2 63.33* 8 7.92 [.08 13] 00 1.00 1.00 02 
denfaktor) ER. 


Anmerkungen. IM = Intrinsische Lernmotivation. *p < .001. 
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Die standardisierten Parameterschätzungen sind Tabelle 29 zu entnehmen. Alle In- 
dikatoren verfügen über signifikante (p < .001) und hohe standardisierte Faktorla- 
dungen, die für tı im Bereich X = .74 und A = .96 und für tz im Bereich X = .78 und 
x = .96 liegen. Die R?-Werte deuten auf überwiegend hohe Indikatorreliabilitaten 
hin. 

Die Reliabilitätsanalysen zu Beginn und zur Mitte des Schuljahres ergaben sehr 
gute Werte von «a = .93/wa = .93 und a2 = .94/w2 = .93 (vgl. Tabelle 30). Die 
deskriptiven Statistiken in Tabelle 30 zeigen, dass die intrinsische Lernmotivation 
zu Beginn und zur Mitte des Schuljahres unter dem theoretischen Mittelwert der 
Skala von 2.5 liegt. Auf deskriptiver Ebene zeigt sich außerdem, dass die intrinsische 
Lernmotivation im Verlauf des Schulhalbjahres sinkt: Zum ersten Messzeitpunkt 
berichten die Schülerinnen und Schüler im Mittel über eine höhere intrinsische 
Lernmotivation (MW = 2.35, SD = 0.83) als zum zweiten Messzeitpunkt (MW = 
2.25, SD = 0.84). Die ICC-Koeffizienten zeigen, dass ein Varianzanteil von 16% 
(t) bzw. 21% (t2) in den Schülereinschätzungen auf Unterschiede zwischen den 
Deutschkursen in der intrinsischen Lernmotivation zurückzuführen ist. Der Rest 
geht auf Unterschiede zwischen den Schülerinnen und Schülern selbst zurück. 


Tabelle 29: Standardisierte Faktorladungen (A) und Reliabilitäts-Schätzungen (R?) 
der Indikatoren im eindimensionalen Modell der intrinsischen Lernmotivation zu 
Beginn und zur Mitte des Schuljahres (MZP 1 und 2) 


MZP1 MZP2 
Skala/ Item x R? x R? 
intrin1 88 .78 91 82 
intrin2 94 88 .96 92 
intrin3 .84 .70 90 82 
intrind .96 93 94 89 
intrin5 81 .65 81 .65 
intrin6 .74 55 .78 .61 


Anmerkungen. Alle Angaben sind auf einem Niveau von p < .001 signifikant. 


Tabelle 30: Skalenmittelwerte (MW), Standardabweichungen (SD), Reliabilitäten (« 
und w) und Intraklassenkorrelationen (ICC) der Skala zur intrinsischen Lernmoti- 
vation zu Beginn und zur Mitte des Schuljahres 


MZP N MW SD a w ICC 
1 804 2.35 0.83 .93 .93 .16 
2 626 2.25 0.84 94 93 21 
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7.4.2 Modellierung der Lernmotivation im Längsschnitt 


Das eindimensionale Messmodell zur Modellierung der intrinsischen Lernmotiva- 
tion im Längsschnitt ist in Abbildung 17 dargestellt. Die Modellgütekriterien weisen 
auf eine gute Anpassung an die empirischen Daten hin: y? = 148.72, df = 45, 
PO?) < .001, CFI = 1.00, TLI = 1.00; RMSEA [90% CI]= .05 [.04, .06], CFit = .26, 
SRMR = .02. Die hohen Korrelationen von 712 = .83 (p < .001) zwischen den la- 
tenten (State-)Faktoren der intrinsischen Lernmotivation weisen auf eine hohe zeit- 
liche Stabilität interindividueller Unterschiede hinsichtlich der intrinsischen Lern- 
motivation (vgl. Geiser, 2011). Die standardisierten Faktorladungen der Indikatoren 
der intrinsischen Lernmotivation liegen im Bereich Auı/ M2 = .74/ .77 und Au/ Aw = 
.96/ .96 (p < .001) (vgl. Abbildung 17). Die geschätzten R?-Werte für die manifesten 
Indikatoren (vgl. Tabelle 31) sind als überwiegend hoch zu bewerten (ti: .54 < R? < 


.91; tz: .60 < R? < .92, p < .001). 
T1 Te 


Kav oz 


Abbildung 17: Eindimensionales Messmodell der intrinsischen Lernmotivation im Längsschnitt 


Anmerkungen. Dargestellt sind standardisierte Parameterschätzungen; die Faktorladungen 
sind auf einem Niveau von p < .001 signifikant. * p < .05; ** p < .01; *** p < .001. 


Tabelle 31: Reliabilitäts-Schätzungen (R?) der Indikatoren im längsschnittlichen 
Messmodell der intrinsischen Lernmotivation 


Item MZP1 MZP2 
intrini 81 .83 
intrin2 90 92 
intrin3 .69 81 
intrin4 .91 90 
intrin5 .63 .69 
intrin6 54 .60 


Anmerkungen. Alle Angaben sind auf einem Niveau von p < .001 signifikant. 
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Langsschnitthches Parcel-Messmodell 


Mit Blick auf die anstehenden statistischen Analysen, in denen in die Strukturglei- 
chungsmodelle mehrere latente Konstrukte simultan eingehen, wurde zur Reduk- 
tion der Modellkomplexität das Item-Parce/ing angewandt (vgl. Abschnitt 6.6.3). Um 
die Item-Parcels zu ermitteln, wurde der balancing approach gewählt. Im Rahmen der 
konfirmatorischen Faktorenanalysen zur Modellierung der intrinsischen Lernmoti- 
vation wurde eine Residualkorrelation spezifiziert, welche beim Parce/ing berücksich- 
tigt wird, damit der bestehende Varianzanteil bestehen bleibt (Little et al., 2013). 
Die beiden Items intrin1 und intrin2 wurden daher vor der Anwendung des balancing 
approach einem Parcel zugeordnet. Das zweite Parcel besteht im Sinne des balancing 
approach aus dem Item mit der höchsten Faktorladung und dem Item mit der nied- 
rigsten Faktorladung. Das Item mit der zweithöchsten Faktorladung und das Item 
mit der zweitniedrigsten Ladung bilden das dritte Parcel. Eine Übersicht über die 
gebildeten Irem-Parcels ist in Tabelle 32 dargestellt. 


Tabelle 32: Übersicht der Item-Parcels mit den jeweiligen Items zu Beginn (tı) und 
zur Mitte (t2) des Schuljahres 


Skala/Parcelnr. Parcel Itemkürzel 


Intrinsische Lernmotivation zu Beginn des Schuljahres (tı) 


1 pm11 aintrinl + aintrin2 
2 pm21 aintrin4 + aintrin6 
3 pm31 aintrin3 + aintrin5 


Intrinsische Lernmotivation zur Mitte des Schuljahres (tə) 


1 pm12 bintrin1 + bintrin2 
2 pm22 bintrin4 + bintrin6 
3 pm32 bintrin3 + bintrin5 


Das Modell mit Item-Parcels weist eine sehr gute Modellpassung auf (y? = 12.20, 
df= 5, p(y’) = .03, CFI = 1.00, TLI = 1.00, RMSEA [90% CI] = .04 [.01, .07], 
CFit = 0.62, SRMR = .01). Die Faktorladungen in diesem Modell sind alle signifi- 
kant (p < .001) und liegen über .89 (vgl. Abbildung 18). 
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Abbildung 18: Längsschnittliches Messmodell der intrinsischen Lernmotivation mit Item-Parcels 


Anmerkungen. Dargestellt sind standardisierte Parameterschätzungen; die Faktorladungen 
sind auf einem Niveau von p < .001 signifikant. * p < .05; ** p < .01; *** p < .001. 


Die Inter-Faktorkorrelation liegt bei .80, was einer hohen zeitlichen Stabilität inter- 
individueller Unterschiede in der intrinsischen Lernmotivation entspricht. Die Re- 
liabilitäten der Indikatoren liegen über .78 und sind somit als gut zu bewerten (vel. 
Tabelle 33). 


Tabelle 33: Reliabilitats-Schatzungen (R?) der Indikatoren der intrinsischen Lern- 
motivation im längsschnittlichen Messmodell mit Item-Parcels 


Skala/Parcel R? 


Intrinsische Lernmotivation ty 


pmil .79 
pm21 81 
pm31 .78 
Intrinsische Lernmotivation tz 

pm12 82 
pm22 85 
pm32 83 


Anmerkungen. Die Angaben sind auf dem Niveau von p < .001 signifikant. 
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7.4.3 Messinvarianz der Lernmotivation über die Zeit 


Um zu überprüfen, ob die Skala zur Messung der intrinsischen Lernmotivation über 
die beiden Messzeitpunkte hinweg hinreichend vergleichbar ist, wurden Messinva- 
rianzanalysen durchgeführt. Die Ergebnisse der Invarianzprüfungen sind Tabelle 
34 (Modell-Fit-Indizes) und Tabelle 35 (Modellvergleiche) zu entnehmen. 


Tabelle 34: Modell-Fit-Indizes des eindimensionalen Parcel-Modells der intrinsi- 
schen Lernmotivation mit unterschiedlichem Grad der Messinvarianz über die 
Zeit 


RMSEA 


Modell x df px) (90% CH Crit SRMR CF è TH 
I 12.20 5 .03 .04 [.01, .07] .62 01 1.00 1.00 
II 14.36 7 .05 .04 [.01, .06] .78 01 1.00 1.00 
III 28.95 9 <.001  .05[.03, .07] 39 .02 1.00 1.00 


Anmerkungen. I = Basismodell konfiguraler Messinvarianz, II = Modell schwacher faktoriel- 
ler Messinvarianz, III = Modell starker faktorieller Messinvarianz. 


Tabelle 35: Ergebnisse der Modellvergleiche 


Modellvergleich AX korr Adf p ACFI 
II vs. I 1.64 2 .44 .000 
II vs. I 17.80 4 .001 -.002 
II vs. I 16.21 2 < .001 .00 


Anmerkungen. I = Basismodell konfiguraler Messinvarianz, II = Modell schwacher faktoriel- 
ler Messinvarianz, III = Modell starker faktorieller Messinvarianz. 


Das Basismodell (Modell D, das die Annahme konfiguraler Messinvarianz prüft, 
wurde in Abschnitt 7.4.2 beschrieben. Für das Modell liegen gute Fit-Werte vor 
(x? = 12.20, df= 5, p(y?) = .03, CFI = 1.00, TLI = 1.00, RMSEA [90% CI] = .04 
[.01, .07], CFit = .62, SRMR = .01), sodass angenommen werden kann, dass die 
Faktorstruktur über die beiden Messzeitpunkten identisch ist. Auch für das Modell 
schwacher faktorieller Invarianz, in dem die Faktorladungen über die Zeit gleichge- 
setzt wurden, liegen gute Fit-Werte vor (x?= 14.36, df= 7; p(y?) = .05, CFI = 1.00, 
TLI = 1.00, RMSEA [90% CI] = .04 [.01, .06], CFit = .78, SRMR = .01). Die Mo- 
dellrestriktionen führen nicht zu einer bedeutsamen Modellverschlechterung gegen- 
über dem Modell I, da der y?-Differenztests nicht signifikant ausfällt (Ay?kor = 1.64, 
Adf= 2, p = .439) und der CFI-Differenzwert unter der Grenze von .01 liegt (ACFI 
= .000). Die Befunde bestätigen somit die Stabilität der Faktorladungen über die 
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Zeit. Im Modell II wurden zusätzlich zur Faktorstruktur und zu den Faktorladun- 
gen auch die Intercepts über die Messzeitpunkte gleichgesetzt (starke faktorielle 
Messinvarianz). Die Modell-Fit-Statistiken weisen auf eine leichte Verschlechterung 
der Anpassungsgüte hin (y? = 28.95, df= 9, p(y?) < .001, CFI = 1.00, TLI = 1.00, 
RMSEA [90% CI] = .05 [.03, .07], CFit = .39, SRMR = .02), gleichwohl die Werte 
von RMSEA, SRMR, CFI und TLI immer noch als gut zu bewerten sind. Der Ver- 
gleich des restringierten Modells mit dem Basismodell und dem Modell schwacher 
faktorieller Invarianz mittels des korrigierten y?-Differenztests legt nahe, das Modell 
zu Gunsten des Basismodells (Ay?korr =17.80, Adf= 4, p = .001) bzw. des Modells 
schwacher faktorieller Invarianz (Ay?kor = 16.21, Adf = 2, p < .001) zu verwerfen. 
Aufgrund der Stichprobensensitivitat des y?-Differenztests wird zusatzlich der CFI- 
Differenztest herangezogen. Nach den Kriterien von Cheung und Rensvold (2002) 
fällt die CFI-Differenz von -.002 nicht bedeutsam aus, sodass die Annahme starker 
faktorieller Messinvarianz nicht abgelehnt werden muss. Die Ergebnisse bestätigen 
somit auch die Stabilität der Intercepts über die Zeit, sodass Mittelwertvergleiche 
über die Zeit zulässig sind. 


7.4.4 Messinvarianz der Lernmotivation über die Geschlechtergruppen 


Nachdem gezeigt wurde, dass die intrinsische Lernmotivation zum Ende und zur 
Mitte des Schuljahres das gleiche Konstrukt abbildet, wird im folgenden Abschnitt 
geprüft, ob sich die Struktur des Konstrukts auch für beide Geschlechter gleicher- 
maßen abbilden lässt. Nur unter dieser Bedingung ist es zulässig, Mittelwerte und 
Regressionskoeffizienten zwischen den Gruppen zu vergleichen. Hierfür muss 
starke faktorielle Messinvarianz vorliegen. Dies wird durch die nachfolgende Prü- 
fung auf Messinvarianz anhand eines multiplen Gruppenvergleichs im Rahmen von 
CFAs geklärt. Die Ergebnisse der Invarianzprüfung sind in Tabelle 36 (Fit-Indizes) 
und Tabelle 37 (Modellvergleiche) dargestellt. 


Tabelle 36: Ergebnisse der Prüfung auf Messinvarianz der intrinsischen Lernmoti- 
vation nach Geschlecht 


Modell x df p% RMSEA [90%CI] Cre SRMR CFI TU 


I weibicn 10.01 5 .08 05 [.00, .09] .46 .01 1.00 99 
I männlich 4.07 5 .54 00 [.00, .06] .87 .01 1.00 1.00 
II 15.27 10 .12 .04 [.00, .07] .71 .01 1.00 1.00 
II 27.44 14 .02 05 [.02, .08] .49 .04 1.00 .99 
IV 39.59 18 <.01 .05 [.03, .08] .34 .03 .99 .99 


Anmerkungen. I weiblich = Basismodell weibliche Stichprobe, I männlich = Basismodell männliche 
Stichprobe, II = Basismodell konfiguraler Messinvarianz, III = Modell schwacher faktoriel- 
ler Messinvarianz, IV = Modell starker faktorieller Messinvarianz. 
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Tabelle 37: Ergebnisse der Modellvergleiche 


Modellvergleich A% korr Adf p ACFI 
II vs. I 11.56 4 .021 -.002 
IV vs. H 23.03 8 .003 -.005 
IV vs. IH 11.48 4 .022 -.003 


Anmerkungen. II = Basismodell konfiguraler Messinvarianz, III = Modell schwacher faktori- 
eller Messinvarianz, IV = Modell starker faktorieller Messinvarianz. 


Im ersten Schritt wurde das Messmodell für beide Gruppen separat geprüft (Modell 
D. Die Fit-Werte der CFAs sind gut bis sehr gut, sodass im nächsten Schritt das 
Baseline-Modell (Modell II) — in dem alle Parameter frei variieren dürfen — im Rah- 
men eines multiplen Gruppenvergleichs für beide Gruppen simultan geschätzt wer- 
den kann. Die Fit-Werte können auch hier als gut bewertet werden und bestätigen 
damit die Annahme von konfiguraler Messinvarianz, d.h. der Gleichheit der Fak- 
torstruktur. Anschließend wurden zur Überprüfung eines Modells schwacher fak- 
torieller Invarianz die Faktorladungen in den beiden Gruppen gleichgesetzt (Modell 
IIT). Der Modell-Fit dieses restringierten Modells ist gut bis sehr gut. Der Vergleich 
mit dem Baseline-Modell mittels des korrigierten y?-Differenztests zeigt eine signi- 
fikante Modellverschlechterung (Ay?korr = 11.56, Adf = 4, p = .021). Die CFI-Diffe- 
renz (ACFI = -.002) liegt allerdings unter dem Cutoff-Wert von .01, sodass die Hy- 
pothese tiber die schwache faktorielle Invarianz nicht verworfen werden muss. 
Um die Mittelwerte zwischen den Gruppen vergleichen zu können, muss starke 
faktorielle Messinvarianz vorliegen. Hierzu wurde das Modell IV spezifiziert, in dem 
zusätzlich zur Faktorstruktur und den Faktorladungen auch die Intercepts der ma- 
nifesten Indikatoren in den beiden Gruppen gleich sind. Der Modell-Fit ist sehr gut, 
allerdings fällt der y?-Differenztests signifikant aus (Aykor = 23.03, Adf = 4, 
p = .003). Daher wird zusätzlich der CFI-Differenztest zum Modellvergleich heran- 
gezogen. Der CFI-Differenzwert liegt mit ACFI = -.005 unter der vorgegebenen 
Cutoff-Grenze, sodass starke faktorielle Messinvarianz angenommen werden kann. 


Unterschiede zwischen Schülerinnen und Schülern in der intrinsischen Lernmotivation 


Nachdem Messäquivalenz in der intrinsischen Lernmotivation zwischen den Grup- 
pen nachgewiesen werden konnte, sind abschließend die Ergebnisse des Mittelwert- 
vergleichs zu Beginn und zur Mitte des Schuljahres in Tabelle 38 dokumentiert. Die 
Referenzgruppe ist dabei die Gruppe der Schüler. Unterschiede werden mittels la- 
tent geschätzter, standardisierter Mittelwertdifferenzen in Skalenpunkten angeben. 
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Tabelle 38: Geschlechtsspezifische latente Mittelwertdifferenzen in der intrinsi- 
schen Lernmotivation zu Beginn (tı) und zur Mitte des Schuljahres (t2) 


Skala AMW SE $ 
Intrinsische Lernmotivation tı 0.66 0.11 < .001 
Intrinsische Lernmotivation ta 0.67 0.01 < .001 


Anmerkungen. Referenzgruppe: männlich; ti: 7 (Schülerinnen) = 427, n (Schüler) = 376; tz: 
n (Schülerinnen) = 348, # (Schüler) = 278. 


Die Analysen belegen signifikante geschlechtsspezifische Unterschiede in der intrin- 
sischen Lernmotivation zu Beginn und zur Mitte des Schuljahres. Schülerinnen wei- 
sen zu Beginn des Schuljahres eine signifikant höhere intrinsische Lernmotivation 
auf als Schüler (AMW = 0.66, SE = 0.11, p < .001). Auch zur Mitte des Schuljahres 
bestehen signifikante Unterschiede in der intrinsischen Lernmotivation in Abhän- 
gigkeit des Geschlechts. Schülerinnen weisen weiterhin eine höhere intrinsische 
Lernmotivation auf als Schüler (AMW = 0.67, SE = 0.10, p < .001). 


7.4.5  Differenzielle Veränderung der Lernmotivation 


Im nachfolgenden Abschnitt wird die Veränderung der intrinsischen Lernmotiva- 
tion im Verlauf eines Schulhalbjahres beschrieben. Hierzu werden zunächst die auf 
Basis des längsschnittlichen Messmodells geschätzten latenten Mittelwerte zu Be- 
ginn und zur Mitte des Schuljahres und anschließend die latente Veränderung im 
Latent-True-Change-Modell betrachtet. Abschließend wird der Einfluss des Ge- 
schlechts und der Deutschnote auf interindividuelle Unterschiede im Ausgangsni- 
veau und der Veränderung der Lernmotivation untersucht. 


Deskriptive Entwicklungen 


Anhand der Werte in Tabelle 39 zeigt sich eine leichte Abnahme in der mittleren 
intrinsischen Lernmotivation (MWu = 2.35, SE = 0.06, MW = 2.25, SE = 0.07). 
Das Gleichsetzen der Mittelwerte über die Zeit führt zu einer signifikanten Modell- 
verschlechterung im Vergleich zum Modell mit frei geschätzten Mittelwerten (y?= 
41.62, df= 10, p2 < .001 , CFI = 1.00, TLI = .99, RMSEA [90% CI] = .06 [.04, 
.08], Cri = 0.13, SRMR = .03, Ay?kor = 7.77, Adf= 1, p = .01). Dies lässt auf eine 
signifikante Abnahme der intrinsischen Lernmotivation schlieBen. Allerdings ist der 
absolute Fit des restriktiveren Modells immer noch als sehr gut zu bewerten, sodass 
die zeitliche Veränderung als gering einzustufen ist. Die Entwicklung der intrinsi- 
schen Lernmotivation im Verlauf des Schulhalbjahres ist in Abbildung 19 zusam- 
menfassend dargestellt. 
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Abbildung 19: Veränderung der intrinsischen Lernmotivation 


Anmerkung. **p < .01 


Veränderung im LTC-Modell 


Zur Modellierung der Veränderung der intrinsischen Lernmotivation über die Zeit 
wurde — analog zur Veränderung der wahrgenommenen Feedbackqualitat — ein La- 
tent-True-Change-Modell geschätzt. Eine latente Differenzvariable bildet die la- 
tente Veränderung der intrinsischen Lernmotivation zwischen dem Beginn des 
Schuljahres und der Mitte des Schuljahres ab. Das LTC-Modell mit standardisierten 
Parameterschätzungen und der Annahme von starker faktorieller Messinvarianz ist 
in Abbildung 20 dargestellt. Das Modell verfügt über eine gute Anpassungsgüte an 
die Daten (y? = 28.95, df= 9, p(y?) < .001, CFI = 1.00, TLI = 1.00, RMSEA [90% 
CI = .05 [.03, .07], Cri = 0.64, SRMR = .02). 

Auch die Ergebnisse der LTC-Analyse zeigen eine signifikante latente Mittel- 
wertdifferenz (AMW = -0.10, SE = 0.03, p < .01), die auf eine bedeutsame Ab- 
nahme der intrinsischen Lernmotivation hinweist (vgl. Tabelle 39). Darüber hinaus 
verdeutlicht die geschätzte Varianz der intrinsischen Lernmotivation zum ersten 
Messzeitpunkt (Var = 0.63, SE = 0.03, p < .001) und der Differenzvariable (Var = 
0.26, SE = 0.03, p < .001), dass signifikante Unterschiede im Ausgangswert und im 
Veränderungswert vorliegen. Die Oberstufenschülerinnen und -schüler unterschei- 
den sich somit bedeutsam sowohl in ihrer intrinsischen Lernmotivation zu Beginn 
des Schuljahres als auch in ihrer Motivationsveränderung im Verlauf des Schulhalb- 
jahres. 
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Tabelle 39: Latente Faktormittelwerte (MW), -varianzen (Var) der intrinsischen 
Lernmotivation zu beiden Messzeitpunkten (t) sowie Mittelwertdifferenzen 


Latente Variable MW (SE) Var (SE) 

Intrinsische Motivation tı 2.35*** (0.06) 0.63*** (0.03) 
Intrinsische Motivation t2 2.25*** (0.07) 0.67*** (0.04) 
A Intrinsische Motivation t2-t; -0.10** (0.03) 0.26*** (0.03) 


Anmerkung. A = Latente Veränderungsvariable. **p < .01, ***p < .001. 


Die latente Korrelation zwischen der Ausgangs- und der Veränderungsvariable der 
intrinsischen Lernmotivation im LTC-Modell (vgl. Abbildung 20) ist signifikant und 
beträgt r = -.27 (p < .001). Damit besteht ein mittelstarker negativer Zusammen- 
hang, der so zu interpretieren ist, dass die Veränderung in der intrinsischen Lern- 
motivation umso stärker ist, je niedriger die intrinsische Lernmotivation zu Beginn 
des Schuljahres ausgeprägt ist. Konkret bedeutet dies, dass sich Schülerinnen und 
Schüler mit einer eher niedrigen intrinsischen Lernmotivation zu Beginn des Schul- 
jahres stärker in der intrinsischen Lernmotivation im Verlauf des Schulhalbjahres 
verändern, während sich Schülerinnen und Schüler mit einer hohen intrinsischen 
Lernmotivation weniger verändern. Da der Veränderungswert im LTC-Modell ne- 
gativ ist (A MW = -0.10) heißt das, dass eine geringe Ausgangsmotivation mit einer 
stärkeren Abnahme in der intrinsischen Motivation einhergeht. 
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Abbildung 20: Latent-True-Change-Modell für die Veränderung der intrinsischen Lernmotivation 


Anmerkungen. Dargestellt sind standardisierte Parameterschätzungen; die Faktorladungen 
sind auf einem Niveau von p < .001 signifikant. A = Latente Veränderungsvariable. 
* p < .05; ** p < .01; *** p < .001. 
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Effekte auf die Veränderung der intrinsischen Lernmotivation 


Um zu untersuchen, welche Merkmale interindividuelle Unterschiede in der intra- 
individuellen Veränderung der intrinsischen Lernmotivation von Schülerinnen und 
Schülern erklären können, wurden das Geschlecht (1 = weiblich) und die 
Deutschnote (höhere Werte = gute Note) als Prädiktoren der Veränderung der 
intrinsischen Lernmotivation in das LTC-Modell aufgenommen. Die absoluten und 
inkrementellen Fit-Indizes verweisen im spezifizierten Modell auf eine gute Daten- 
anpassung (y?= 28.24, df= 17, p(y?) = .04, CFI = 1.00, TLI = .99, RMSEA [90% 
CI] = .04 [.01, .06], CFit = 0.83, SRMR = .02). Obschon der x?-Test signifikant 
ausfällt, liegen die anderen Fit-Indizes im Bereich der gängigen Cutoff-Werte. Die 
unstandardisierten und standardisierten Regressionskoeffizienten aus der Struk- 
turgleichungsanalyse sind in Tabelle 40 dargestellt. 


Tabelle 40: Standardisierte und unstandardisierte Regressionskoeffizienten im La- 
tent-True-Change-Modell mit Geschlecht und Deutschnote als Prädiktoren der 
Motivationsveränderung 


Unstandardisierte Effekte Standardisierte Effekte 
Level Change Level Change 
Prädiktoren B (SE) B (SE) B (SE) B (SE) 
Geschlecht 41*** (0.09) .07 (0.07) .26*** (0.05) .07 (0.06) 
Note .28*** (0.04) -.07* (0.03) 34*** (0.04) -.12* (0.05) 
R? „226 .015 


Anmerkungen. Das Geschlecht ist eine dichotome Variable (1 = weiblich); die Deutschnote 
wurde umgepolt (hohe Werte entsprechen einer guten Note). *p < .05; **p < .01; 
Pr < 001. 


Zunächst können signifikante Effekte der Deutschleistung und des Geschlechts auf 
den Ausgangswert der intrinsischen Lernmotivation nachgewiesen werden: Eine 
höhere Deutschleistung der Schülerinnen und Schüler geht mit einer höheren 
intrinsischen Lernmotivation zu Beginn des Schuljahres einher (B = .34, SE = 0.04, 
p< .001). Auch unter Kontrolle der Deutschleistung zeigen Schülerinnen zu Beginn 
des Schuljahres eine höhere intrinsische Lernmotivation als Schüler (B = .26, 
SE = 0.05, p < .001). Das Modell erklärt einen statistisch bedeutsamen Anteil der 
Varianz in der intrinsischen Lernmotivation zu Beginn des Schuljahres (R? = .23, 
p<.001). 

Weiterhin zeigen sich keine signifikanten Effekte des Geschlechts (B = .07, 
SE = 0.06, p = .29) auf die Veränderung der intrinsischen Lernmotivation. Demzu- 
folge verändern sich Schülerinnen und Schüler — unabhängig von ihrem Geschlecht 
— in ähnlicher Weise in der intrinsischen Lernmotivation. Währenddessen können 
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signifikante negative Effekte der Deutschnote auf die Veränderung der intrinsi- 
schen Lernmotivation nachgewiesen werden (B = -.12, SE = 0.05, p = .02). Die 
intrinsische Motivation nimmt im Stichprobendurchschnitt über die Zeit ab; dem- 
nach ist eine höhere Leistung mit einer stärkeren Abnahme der Motivation assozi- 
iert. Allerdings ist die Varianzaufklärung hinsichtlich der Veränderung der intrinsi- 
schen Lernmotivation nur sehr gering (R? = .02, p = .25). 


7.4.6 Bivariate Latent-True-Change-Modelle 


Zur Analyse der Zusammenhänge zwischen den Dimensionen der Feedbackqualität 
und der intrinsischen Lernmotivation über die Zeit (Teilfragestellung F2a und Teilfrage- 
stellung F2b) wurden sukzessive vier bivariate LTC-Modelle für jede der vier Feed- 
backdimensionen spezifiziert‘. Die auf Grundlage der einzelnen Messmodelle er- 
mittelten latenten Interkorrelationen der Variablen können den Tabelle 41 bis Ta- 
belle 44 entnommen werden. 


Tabelle 41: Latente Interkorrelationen der ergebnisorientierten Feedbackdimen- 
sion und der Lernmotivation im bivariaten LTC-Modell 


Latente Variable (1) (2) (3) (4) 
(1) EO tı 1.00 -.29*** Oe -.05 
(2) AEO tz-tı 1.00 -.09 .16** 
(3)IMtı 1.00 -.27*** 
(4) AIM t2-tı 1.00 


Anmerkungen. EQ = Ergebnisorientierte Dimension; IM = Intrinsische Lernmotivation; A 
= Latente Veränderungsvariable; alle Korrelationen sind auf einem Niveau von p < .001 
signifikant. 


Tabelle 42: Latente Interkorrelationen der prozessorientierten Feedbackdimension 
und der Lernmotivation im bivariaten LTC-Modell 


Latente Variable (1) (2) (3) (4) 
(1) PO tr 1.00 -.08*** gee -.02 
(2) APO tz-t 1.00 -.04* 06*** 
(3) IM ti 1.00 -.11*** 
(4) AIM tz-tı 1.00 


Anmerkungen. PO = Prozessorientierte Dimension; IM = Intrinsische Lernmotivation; A = 
Latente Veränderungsvariable; alle Korrelationen sind auf einem Niveau von p < .001 sig- 
nifikant. 


6 Ein Modell, in dem alle vier Feedbackdimensionen simultan in die Analyse einbezogen wurden, 
konnte aufgrund des Vorliegens von Multikollinearität zwischen den Dimensionen von Feedback 
nicht geschätzt werden. 
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Tabelle 43: Latente Interkorrelationen der selbstregulationsorientierten Feedback- 
dimension und der Lernmotivation im bivariaten LTC-Modell 


Latente Variable (1) (2) (3) (4) 
(1) SO t1 1.00 -.30*** DIR -.12* 
(2) ASO t2-t1 1.00 -.06 YA: 
(3) IMtl 1.00 _. 27% 
(4) AIM 12-t1 1.00 


Anmerkungen. SO = Selbstregulationsorientierte Dimension; IM = Intrinsische Lernmotiva- 
tion; A = Latente Veränderungsvariable; alle Korrelationen sind auf einem Niveau von 
p < .001 signifikant. 


Tabelle 44: Latente Interkorrelationen der dialogorientierten Feedbackdimension 
und der Lernmotivation im bivariaten LTC-Modell 


Latente Variable (1) (2) (3) (4) 
(1) DO ti 1.00 -. 38% us: -.15* 
(2) ADO t>-tı 1.00 -.04 „26*** 
(3) IM ti 1.00 ar 
(4) AIM t2-tı 1.00 


Anmerkungen. DO = Dialogorientierte Dimension; IM = Intrinsische Lernmotivation; A = 
Latente Veränderungsvariable; alle Korrelationen sind auf einem Niveau von p < .001 sig- 
nifikant. 


Abbildung 21 zeigt die vier bivariaten LTC-Modelle mit standardisierten Parame- 
terschätzungen und der Annahme starker faktorieller Messinvarianz der Kon- 
strukte. Die Abbildung liefert auch Informationen über die Anpassungsgüte der 
Modelle. In jedem bivariaten LTC-Modell wurden insgesamt zwei (Residual-)Kor- 
relationen zugelassen: zwischen den Ausgangsvariablen der jeweiligen Feedbackdi- 
mension und der intrinsischen Lernmotivation zu Beginn des Schuljahres (tı) sowie 
zwischen den Veränderungsvariablen der beiden Konstrukte im Verlauf des Schul- 
halbjahres (t2-tı). Darüber hinaus wurden zwei kreuzverzögerte Pfade miteinbezo- 
gen: der Effekt vom Ausgangswert der Feedbackdimension auf die Veränderung 
der intrinsischen Lernmotivation sowie der Effekt vom Ausgangswert der intrinsi- 
schen Lernmotivation auf die Veränderung der Feedbackwahrnehmung. 

Die Analyse ergibt, dass die Modelle sehr gut auf die Daten passen (vgl. Abbil- 
dung 21). Der Quotient aus Chi-Quadrat und Freiheitsgraden sowie RMSEA und 
SRMR zeigen geringe Werte, die unter den Cutoff-Werten liegen und damit auf 
einen schr guten Modell-Fit hinweisen. Auch die CFI- und TLI-Werte liegen inner- 
halb der üblichen Grenzen und weisen auf eine sehr gute Modellpassung hin. 
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Hinsichtlich der Zusammenhänge zwischen den Konstrukten (jeweilige Feed- 
backdimension und intrinsische Motivation) und der zeitlich parallelen Verände- 
rungen im Schulhalbjahr (Hypothese 2a-1 und Hypothese 2a-2) konnten in allen vier 
Modellen erwartungsgemäß statistisch signifikante Korrelationen zwischen den 
Ausgangswerten zu Beginn des Schuljahres (.25 < r < .33; p < .001) nachgewiesen 
werden. Das heißt, je positiver die Schülerinnen und Schüler das Feedback der Lehr- 
kraft zu Beginn des Schuljahres wahrnehmen, desto höher ist auch ihre intrinsische 
Lernmotivation und umgekehrt. Auch die latenten Korrelationen der Verände- 
rungswerte liegen im moderaten, positiven Bereich zwischen .12 < r < .28 (p < .05), 
wobei der höchste Zusammenhang zwischen der Veränderung des selbstregulati- 
onsorientierten Feedbacks und der Veränderung der intrinsischen Lernmotivation 
besteht. Demnach gehen Veränderungen in der Wahrnehmung der Feedbackdi- 
mensionen mit einer Veränderung der intrinsischen Lernmotivation im Verlauf des 
Schulhalbjahres einher. 

Nun werden die kreuzverzögerten Pfadkoeffizienten in den einzelnen Modellen 
betrachtet (Hypothese 2b-1 und Hypothese 2b-2). Im Einzelnen werden interindividu- 
elle Unterschiede in der intraindividuellen Veränderung der intrinsischen Lernmo- 
tivation signifikant durch die Ausprägung des wahrgenommenen selbstregulations- 
orientierten Feedbacks (ß = -.12, SE = 0.07, p = .049) und des dialogorientierten 
Feedbacks (B = -.15, SE = 0.06, p = .021) erklärt. Die Effekte sind negativ. Da die 
intrinsische Lernmotivation im Mittel über die Zeit abnimmt, sind die Befunde so 
zu interpretieren, dass eine höher ausgeprägte Wahrnehmung des selbstregulations- 
und dialogorientierten Feedbacks zu Beginn des Schuljahres die Abnahme der 
intrinsischen Motivation im Schulhalbjahr verstärkt. Allerdings fallen die Pfadkoef- 
fizienten und auch die R?-Werte klein aus, was darauf hinweist, dass die kreuzver- 
zögerten Effekte wenig zusätzliche Varianz erklären können. Entgegen der aufge- 
stellten Hypothese zeigen sich keine signifikanten Effekte vom wahrgenommen Er- 
gebnisfeedback (B = -.05, SE = 0.06, p = .42) und Prozessfeedback (B = -.07, SE = 
0.06, p = .24) zu Beginn des Schuljahres auf die Veranderung der intrinsischen Lern- 
motivation im Halbjahr. 

Unterschiede in der Veränderung der Feedbackwahrnehmung durch die intrin- 
sische Lernmotivation zu Beginn des Schuljahres können nur in Bezug auf die Pro- 
zessdimension von Feedback erklärt werden. Der kreuzverzögerte Effekt beträgt 

= -.12 (SE = 0.06, p = .036), ist allerdings als sehr klein einzustufen und besitzt 
damit eine geringe Varianzaufklärung (R? = 1.3%). Der negative Pfadkoeffizient ist 
so zu interpretieren, dass eine höhere intrinsische Lernmotivation zu Beginn des 
Schuljahres zu einer Abnahme der Prozessorientierung führt. Die kreuzverzögerten 
Effekte von der intrinsischen Lernmotivation auf die Veränderung der Wahrneh- 
mung der Ergebnisdimension (8 = -.09, SE = 0.05, p = .08), der Selbstregulations- 
dimension (8 = -.06, SE = 0.05, p = .20) und der Dialogdimension (B = -.04, SE = 
0.07, p = .60) fallen nicht statistisch signifikant aus, sodass die Annahmen in Bezug 
auf diese Zusammenhänge zu verwerfen sind. 
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Abbildung 21: Bivariate Latent-True-Change-Modelle für den Zusammenhang zwischen Feedbackdimen- 
sionen und der intrinsischen Lernmotivation 


Anmerkungen. Vereinfachte Darstellung ohne Messmodelle; Angabe der standardisierten Pa- 
rameterschätzungen; nicht-signifikante Pfade sind gestrichelt dargestellt; A = Latente Ver- 
anderungsvariable. *p < .05, **p < .01, ***p < .001. 
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7.5 Indirekte Wirkungen von Feedback auf die 
Lernmotivation 


Im folgenden Abschnitt wird untersucht, ob die Dimensionen von wahrgenomme- 
nem Feedback einen indirekten Effekt auf die Veränderung der intrinsischen Lern- 
motivation über die Zeit ausüben und inwiefern eine vermittelnde Wirkung der 
wahrgenommenen Nützlichkeit sowie des wahrgenommenen Kompetenzerlebens 
vorliegt (Hauptforschungsfrage IIN. Dafür wird zunächst die faktorielle Struktur der 
Mediatorvariablen geprüft und im Anschluss werden die deskriptiven Kennwerte 
berichtet. 


7.5.1 Faktorenstruktur und deskriptive Statistik der Skala Nützlichkeit 


Im Rahmen einer konfirmatorischen Faktorenanalyse wurde die Eindimensionalität 
der Skala zur Erfassung der wahrgenommenen Nützlichkeit von Feedback geprüft. 
In Abbildung 22 ist das postulierte Ein-Faktormodell dargestellt. 
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Abbildung 22: Ein-Faktormodell der Skala Wahrgenommene Nützlichkeit von Feedback 


Für das Gesamtmodel fällt der x?-Test signifikant aus, die übrigen Fit-Indizes ver- 
weisen auf eine gute bis akzeptable Passung des Modells (y?= 7.29, df= 2, p(y?) = 
.03, CFI = 1.00, TLI = 1.00, RMSEA [90% CI] = .07 [02, .12], CFit = 0.24, 
SRMR = .01). Die Ergebnisse des Messmodells zeigen hohe und signifikante Fak- 
torladungen (A 2 .70). Die R?-Werte können der Tabelle 45 entnommen werden. 
Die Reliabilitatsanalysen ergeben gute Werte von « = .85/w = .85. Die deskriptive 
Auswertung zeigt, dass die wahrgenommene Niitzlichkeit von Feedback mit einem 
Mittelwert von MW = 2.93 (SD = 0.54) tiber dem theoretischen Mittelwert der Skala 
von 2.5 liegt. Die Ausprägung für die ICC zeigt, dass rund 20% der Varianz in den 
Schilerwahrnehmungen durch Unterschiede zwischen den Deutschkursen erklart 
werden kann. 
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Tabelle 45: Reliabilitäts-Schätzungen (R?) der Indikatoren im eindimensionalen 
Modell der wahrgenommenen Nützlichkeit zur Mitte des Schuljahres (t2) 


Item R? 
bfbnutl .78 
bfbnut2 .68 
bfbnut3 .79 
bfbnut5 48 


Anmerkungen. Alle Angaben sind auf einem Niveau von p < .001 signifikant. 


7.5.2 Faktorenstruktur und deskriptive Statistik der Skala 
Kompetenzerleben 


Die Prüfung der faktoriellen Validität der Skala Kompetenzerleben erfolgte auch 
hier im Rahmen einer konfirmatorischen Faktorenanalyse. Das spezifizierte Mess- 
modell mit sechs manifesten Indikatoren führt zu einem unakzeptablen Modell-Fit 
(y2= 260.33, df= 9, p(y?) < .001, CFI = .95, TLI = .91, RMSEA [90% CI] = .21 
[.19, .23], CFit = 0.00, SRMR = .06). Insbesondere die Werte für den y?-Test, den 
Quotienten aus y?/dfund den RMSEA liegen außerhalb der geforderten Grenzbe- 
reiche. Daher werden sukzessive zwei Items (bAomp4 „Im Deutschunterricht finden 
meine Leistungen Anerkennung bei meinen Mitschüler/innen“ und bkomp6 „Im 
Deutschunterricht vermittelt meine Lehrkraft mir den Eindruck, dass sie mit mei- 
nen Leistungen zufrieden ist“) mit vergleichsweise geringeren Faktorladungen 
(bkomp#:\ = .58; bkomp6: ) = .72) und geringeren Indikatorreliabilitäten (b£omp4: 
R2= .34; bkomp6: R?= .52) ausgeschlossen. Der Ausschluss führt zu einer Verbesse- 
rung des Modell-Fits (y?= 53.32, df= 2, p(y?) < .001, CFI = .99, TLI = .96, RMSEA 
[90% CI] = .20 [.16, .25], CFit = 0.00, SRMR = .03). Allerdings liegen die Werte für 
x2/df und RMSEA immer noch in einem nicht zufriedenstellenden Bereich. Die 
Modification Indices im Mplus Output zeigen an, dass das Zulassen der Residualkor- 
relation (Kline, 2016) zwischen den Indikatoren bkomp2 und bkomp3 (aufgrund der 
benachbarten Platzierung im Fragebogen) den y?-Wert verringern würde. Die Mo- 
dellierung dieser Residualkorrelation führt zu einer substanziellen Verbesserung des 
Modell-Fits (y?= 2.50, df= 1, p(y?) = .11, CFI = 1.00, TLI = 1.00, RMSEA [90% 
CI = .05 [.00, .13], CFit = 0.37, SRMR = .004). In Abbildung 23 ist das finale Ein- 
Faktormodell mit vier manifesten Indikatoren und spezifizierter Residualkorrela- 
tion dargestellt. 
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Abbildung 23: Ein-Faktormodell der Skala Wahrgenommenes Kompetenzerleben 
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Die Ergebnisse des Messmodells zeigen hohe und signifikante Faktorladungen (A 2 
.72). Die R?-Werte können der Tabelle 46 entnommen werden. Die Reliabilitätsana- 
lysen ergeben gute Werte von « = .82/w = .80. Hinsichtlich der deskriptiven Statis- 
tiken zeigt sich für die Variable ein Mittelwert von MW = 2.79 (SD = 0.65), der 
über dem theoretischen Mittelwert der Skala von 2.5 liegt. Der ICC-Koeffizient 
zeigt, dass ein Varianzanteil von 7% auf die Zugehörigkeit zu einem Deutschkurs 
zurückzuführen ist. 


Tabelle 46: Reliabilitats-Schatzungen (R?) der Indikatoren im eindimensionalen 
Modell des wahrgenommenen Kompetenzerlebens zur Mitte des Schuljahres (tz) 


Item R? 
bkomp1 58 
bkomp2 63 
bkomp3 52 
bkomp5 56 


Anmerkungen. Alle Angaben sind auf einem Niveau von p < .001 signifikant. 
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7.5.3 Mediationsanalysen 


Die Prüfung der Hypothesen, in denen von der mediierenden Bedeutung der wahr- 
genommenen Nützlichkeit von Feedback und des wahrgenommenen Kompe- 
tenzerlebens bei der Vorhersage der Veränderung der intrinsischen Lernmotivation 
ausgegangen wird, erfolgte im Rahmen von mehreren separaten Strukturgleichungs- 
modellen, in die die unterschiedlichen Ausgangswerte der Feedbackdimensionen 
(tı) als unabhängige Variablen einzeln in das Mediationsmodell aufgenommen wur- 
den. Das Geschlecht und die Deutschnote wurden als Kontrollvariablen in den 
Analysen mitberücksichtigt. 

Zunächst wurde ein Gesamtmodell geschätzt, in das alle Variablen ohne Spezi- 
fizierung von direkten und indirekten Effekten aufgenommen wurden. Das Ge- 
samtmodell weist eine gute Modellpassung auf (?= 689.53, df= 422, p(y?) < .001, 
CFI = .96, TLI = .95, RMSEA [90% CI] = .03 [.02, .03], CFit = 1.00, SRMR = .04). 
In Tabelle 47 sind die latenten Interkorrelationen zwischen den Variablen darge- 
stellt. Es liegen signifikante positive Zusammenhänge zwischen den einzelnen 
Feedbackdimensionen und der wahrgenommenen Nützlichkeit (32 < r < .62, p < 
.001) sowie dem wahrgenommenen Kompetenzerleben (.27 < r < .34, p < .001) 
vor. Die wahrgenommene Nützlichkeit korreliert signifikant positiv mit dem wahr- 
genommenen Kompetenzerleben (r = .49, p < .001). Die einzelnen Feedbackdi- 
mensionen korrelieren signifikant positiv mit der intrinsischen Lernmotivation zu 
Beginn des Schuljahres (.24 < r < .33, p < .001), nicht aber mit der Veränderung 
der Motivation (r < -.07, n. s.). Die wahrgenommene Nützlichkeit von Feedback 
und das Kompetenzerleben hängen sowohl mit der intrinsischen Lernmotivation 
zu Beginn des Schuljahres (Nützlichkeit: r = .39, Kompetenzerleben: r = .49, p < 
.001) als auch mit der Veränderung im Laufe des Schuljahres (Nützlichkeit: r = .20, 
Kompetenzerleben: r = .20, p < .001) signifikant positiv zusammen. 
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Das Mediationsmodell mit allen Feedbackdimensionen istin Abbildung 24 mit stan- 
dardisierten Parameterschätzungen dargestellt. Das Modell verfügt über eine gute 
Anpassungsgüte an die Daten (vgl. Tabelle 48). Da die einzelnen Feedbackdimen- 
sionen nicht gleichzeitig, sondern separat in das Mediationsmodell eingeschlossen 
wurden, werden in der Tabelle vier Modell-Fit-Statistiken berichtet. Zwar fallen die 
-Werte signifikant aus und ein CFI-Wert liegt mit CFI = .94 knapp unter der 
geforderten Grenze von .95, allerdings liegen die anderen Fit-Indizes im Bereich 
der angestrebten Cutoff-Werte (2.33 < y?/df < 2.55, .04 < RMSEA < .04, .04 < 
SRMR < .04, 94 < CFI < .95). 


Tabelle 48: Fit-Indizes des Strukturgleichungsmodells für jede Dimension der 
Feedbackqualität 


Modell y2 df BA cn Crt SRMR CFI THI 
Ergebnisorientiert 

378.61 151 <.001 .04 [.04, .05] 98 .04 .95 .93 
Prozess 

353.37 151 <.001 .04 [.04, .05] 1.00 .04 95.94 
Selbstregulation 

377.37 151 <.001 .04 [.04, .05] 98 .04 94.93 
Dialog 

384.84 151 <.001 .04 [.04, .05] 97 .05 95. 4.93 


Anmerkung. CI = Confidence Interval. 
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Abbildung 24: Strukturgleichungsmodell zur Vorhersage der Veränderung von intrinsischer Lernmotiva- 
tion über die wahrgenommene Nützlichkeit und das Kompetenzerleben unter Kontrolle von Deutschnote 
und Geschlecht 


Anmerkungen. Fett gedruckte Werte: p < .001, **p < .01, *p < .05; Geschlecht: 1 = weiblich, 
0 = männlich, Notenstufen: 1 = sehr gut bis 6 = ungenügend; Angabe standardisierter Pa- 
rameterschätzungen; Abgetragen sind signifikante Pfade; A = Latente Veränderungsvari- 
able. Erste Angabe: Ergebnisorientierte Dimension, zweite Angabe: Prozessorientierte Di- 
mension, dritte Angabe: selbstregulationsorientierte Dimension, vierte Angabe: dialogorien- 
tierte Dimension. 
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Einfluss der wahrgenommenen Feedbackqualitat auf die Motivationsentwicklung 


Zunächst werden die totalen Effekte betrachtet (vgl. Tabelle 49), die statistisch den 
direkten Effekten von den Dimensionen der wahrgenommenen Feedbackqualität 
auf die Motivationsentwicklung in einem Strukturgleichungsmodell ohne Berück- 
sichtigung der wahrgenommenen Nützlichkeit und des Kompetenzerlebens als Me- 
diatorvariablen entsprechen (vgl. Abschnitt 7.4.6).’ Es zeigt sich ein statistisch sig- 
nifikanter totaler Effekt von der dialogorientierten Dimension auf die Veränderung 
der intrinsischen Motivation, allerdings fällt dieser negativ aus (B = -.19, SE = .06, 
p= .003, 95% CI [-.34, -.08]). Der schwach negative Effekt sagt aus, dass eine höher 
ausgeprägte Wahrnehmung des dialogorientierten Feedbacks zu Beginn des Schul- 
jahres die Abnahme der intrinsischen Motivation im Schulhalbjahr verstärkt. Auch 
die ergebnisorientierte, prozessorientierte und selbstregulationsorientierte Dimen- 
sion der Feedbackqualität üben einen schwach negativen totalen Effekt aus, der 
aber statistisch nicht signifikant ist (ergebnisorientiert tı: B = -.06, SE = .07, p = .39, 
95% CI [-.16, .003]; prozessorientiert ti: B = -.03, SE = .07, p = .71, 95% CI [-.11, 
.07]; selbstregulationsorientiert tı: B = -.05, SE = .06, p = .35, 95% CI [-.11, .12]). 

Im Einklang mit den Auswertungen im LTC-Modell (vgl. Abschnitt 7.4.6) kön- 
nen somit auch in den Mediationsanalysen keine signifikanten positiven Zusam- 
menhänge zwischen den Feedbackdimensionen und der Motivationsentwicklung 
nachgewiesen werden. Die fehlenden totalen Effekte der Feedbackdimensionen 
können methodisch sog. Suppressor-Effekte darstellen (vgl. Abschnitt 6.6.4). Wie 
in Abbildung 24 zu erkennen, fallen die direkten Effekte von den Feedbackdimen- 
sionen auf die Motivationsveränderung signifikant negativ aus, während die indi- 
rekten Effekte positiv sind. Durch die gegenläufigen Richtungen der direkten und 
indirekten Effekte können sich die totalen Effekte in Summe gegenseitig aufheben. 
Bei alleiniger Betrachtung der bivariaten Beziehungen würde der Einfluss von Feed- 
back auf die Motivationsentwicklung in den Mediationsmodellen somit unterschätzt 
werden. 


Indirekte Effekte via wahrgenommene Nützlichkeit und Kompetenzerleben 


Für die interessierenden Fragestellungen nach der mediierenden Bedeutung der 
wahrgenommenen Nützlichkeit (Teiffragestellung 3a) und des wahrgenommenen 
Kompetenzerlebens (Tedfragestellung 3b) für die Motivationsentwicklung werden die 
indirekten Effekte im Strukturgleichungsmodell betrachtet. 

Zunächst zeigt sich, dass alle vier Feedbackdimensionen zu tı einen statistisch 
signifikanten positiven Effekt auf die wahrgenommene Nützlichkeit zu t2 haben 
(direkte Effekte: ergebnisorientiert tı: 8 = .61, SE = .05, p < .001; prozessorientiert 
ti: B = .55, SE = .04, p < .001; selbstregulationsorientiert ti: B = .49, SE = .05, 
p< .001; dialogorientiert t: B = .31, SE = .06, p < .001), wobei der Effekt der 


7 Die totalen Effekte sind in Abbildung 24 nicht ablesbar, da sie sich aus den jeweiligen direkten und 
indirekten Effekten zusammensetzen. 
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ergebnisorientierten Dimension auf die Nützlichkeit am stärksten ausfällt. Auch die 
direkten Effekte der Feedbackdimensionen auf das wahrgenommene Kompetenz- 
erleben zu tz fallen signifikant positiv aus (direkte Effekte: ergebnisorientiert tı: 
B = .25, SE = .05, p < .001; prozessorientiert ti: 8 = .25, SE = .05, p < .001; selbst- 
regulationsorientiert ti: B = .24, SE = .05, p < .001; dialogorientiert ti: B = .19, 
SE = .06, p < .001). Daraus folgt, dass mit einer hohen Auspragung des wahrge- 
nommenen Feedbacks eine höhere wahrgenommene Nützlichkeit und ein höheres 
wahrgenommenes Kompetenzerleben einhergehen. Die wahrgenommene Nütz- 
lichkeit von Feedback zu tıhat wiederrum einen schwachen bis moderaten positiven 
Effekt auf die Veränderung der intrinsischen Motivation im Verlauf des Schulhalb- 
jahres (15 < B < .26, .08 < SE < .11, p < .05). Da die intrinsische Lernmotivation 
im Mittel abnimmt, bedeutet der positive Effekt, dass eine hohe Auspragung in der 
wahrgenommenen Nützlichkeit die Abnahme in der intrinsischen Lernmotivation 
abmildert. Das wahrgenommene Kompetenzerleben zu tıhat einen moderat positi- 
ven Effekt auf die Veränderung der intrinsischen Motivation (43 < B < .38, SE = 
.12, p < .001). Das bedeutet auch hier, dass eine hohe Ausprägung des wahrgenom- 
menen Kompetenzerlebens zu einer verminderten Abnahme der intrinsischen Mo- 
tivation führt. 

Dementsprechend zeigen sich schwach positive indirekte Effekte auf die Ver- 
änderung der intrinsischen Motivation vermittelt über die wahrgenommene Nütz- 
lichkeit (indirekte Effekte: ergebnisorientiert ti: 8 = .16, SE = .07, p = .02, 95% CI 
[.14, .22]; prozessorientiert tı: B = .11, SE = .05, p = .04, 95% CI [.04, .15]; selbst- 
regulationsorientiert tı: B = .09, SE = .05, p = .06, 95% CI [.04, .13]; dialogorientiert 
ti: B = .05, SE = .03, p = .11, 95% CI [.02, .07]) sowie schwach positive indirekte 
Effekte auf die Veränderung der intrinsischen Motivation vermittelt über das wahr- 
genommene Kompetenzerleben (indirekte Effekte: ergebnisorientiert tı: B = .10, 
SE = .04, p = .01, 95% CI [.04, .15]; prozessorientiert ti: 8 = .10, SE = .04, p = .01, 
95% CI [.06, .18]; selbstregulationsorientiert tı: 8 = .09, SE = .05, p = .002, 95% CI 
[.03, .16]; dialogorientiert tı: B = .08, SE = .06, p = .01, 95% CI [.06, .18]). Mit der 
wahrgenommenen Nützlichkeit als vermittelnde Variable fällt der indirekte Effekt 
der ergebnisorientierten Dimension am stärksten aus. Mit dem Kompetenzerleben 
als vermittelnde Variable fallen die indirekten Effekte der ergebnis- und prozessoti- 
entierten Dimensionen am stärksten aus. Die Effekte bleiben auch unter Kontrolle 
des Geschlechts und der Vorleistung bestehen. 

Gemäß der Bias-korrigierten Boot-Strap-Konfidenzintervalle sind die indirek- 
ten Effekte auf dem 5%-Niveau signifikant von Null verschieden. Mit den spezifi- 
zierten Modellen konnten zwischen 11.7% und 38.8% der Varianz in der Einschät- 
zung der wahrgenommenen Nützlichkeit, zwischen 39.5% und 42.0% der Varianz 
in der Einschätzung des wahrgenommenen Kompetenzerlebens und zwischen 
17.4% und 22.7% der Varianz in der Veränderung der intrinsischen Lernmotivation 
aufgeklärt werden. 
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Die indirekten sowie totalen Effekte der wahrgenommenen Dimensionen der 
Feedbackqualität auf die Veränderung der intrinsischen Lernmotivation sind zu- 
sammenfassend in Tabelle 49 dargestellt. 


Tabelle 49: Indirekte und totale Effekte der Dimensionen der Feedbackqualität 
auf die Veränderung der intrinsischen Lernmotivation über die wahrgenommene 
Nützlichkeit und das wahrgenommene Kompetenzerleben 


Veränderung der intrinsischen Lernmotivation 


ß SE p 95% CI 
Ergebnisorientiert 
Summe indirekt .25 0.06 <.000 [.19, .33] 
Direkt -.31 0.10 .001 [--45, -.22] 
Total -.06 0.07 387 [-.16, .00] 
Prozessorientiert 
Summe indirekt .21 0.05 <.000 [.12, .25] 
Direkt -.23 0.08 .003 [-.35, -.11] 
Total -.03 0.07 .707 [-.11, .07] 
Selbstregulationsorientiert 
Summe indirekt .18 0.05 <.000 [.13, .24] 
Direkt -.24 0.07 <.001 [-.34, -.13] 
Total -.05 0.06 349 [-.11, .12] 
Dialogorientiert 
Summe indirekt 13 0.04 .001 [.08, .16] 
Direkt -.32 0.06 <.001 [--49, -.22] 
Total -.19 0.06 .003 [-.34, -.08] 


Anmerkungen. Angegeben sind standardisierte Koeffizienten; signifikante Effekte sind fett 
gedruckt; CI = Confidence Interval. 


8 Zusammenfassung und Diskussion der 
Ergebnisse 


In den folgenden Abschnitten werden die zentralen Ergebnisse der Arbeit zusam- 
mengefasst und in Verbindung mit den aktuellen Forschungsbefunden diskutiert. 
In Abschnitt 8.1.1 erfolgt dies für die Hanpfforschungsfrage I, in Abschnitt 8.1.2 für 
die Hauptforschungsfrage II und in Abschnitt 8.1.3 schließlich für die Hanpfforschungs- 
frage III. Daran anknüpfend werden Limitationen der Arbeit diskutiert (Abschnitt 
8.2) und Implikationen der Studie für die empirische Forschung (Abschnitt 8.3) so- 
wie für die schulische Praxis (Abschnitt 8.4) abgeleitet. 


8.1 Zusammenfassung der zentralen Befunde 


8.1.1  Differenzielle Wahrnehmung von Feedback 


Wie Schülerinnen und Schüler die Qualität ihres Unterrichts wahrnehmen ist von 
hoher Relevanz für ihren Lernprozess und Gegenstand verschiedener empirischer 
Studien (Fauth et al., 2014; Igler et al., 2019; Kunter et al., 2007; Wagner et al., 2016; 
Willems, 2011, 2022a, 2022b). Ausgehend von den Annahmen etablierter Ange- 
bots-Nutzungs-Modelle ging diese Arbeit zunächst der Frage nach, wie Schülerin- 
nen und Schüler Feedback — als ein relevantes Qualitatsmerkmal von Unterricht — 
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wahrnehmen und inwieweit das Geschlecht und die Leistung als individuelle Merk- 
male der Schülerinnen und Schüler differenzielle Feedbackwahrnehmungen und 
Wahrnehmungsveränderungen erklären (Haupfforschungsfrage 1). 


Faktorielle Struktur und Dimensionalität der wahrgenommenen Feedbackqualitat im Quer- 
und Längsschnitt 


Da es bisher an Instrumenten zur Erfassung der wahrgenommenen Feedbackqua- 
lität aus der Sicht von Schülerinnen und Schülern mangelt, fokussierten die ersten 
Teslfragestellungen auf forschungsmethodische Aspekte und zielten auf die Untersu- 
chung der faktoriellen Struktur und Dimensionalität der wahrgenommenen Feed- 
backqualität sowie der Messinvarianz des Konstrukts über die Zeit und über Ge- 
schlechtergruppen hinweg ab. Die faktoranalytischen Auswertungen zur individu- 
ellen Wahrnehmung der Feedbackqualität aus der Sicht von Schülerinnen und Schü- 
lern (Teilfragestellung 1a) zeigten, dass ein Modell mit vier korrelierten Faktoren der 
wahrgenommenen Feedbackqualität sowohl gegenüber einem Generalfaktormodell 
als auch gegenüber einem Faktormodell höherer Ordnung zu bevorzugen ist. Somit 
stützt das empirisch vorgefundene Strukturmodell mit vier korrelierten Faktoren 
auch die theoretisch-konzeptuelle Annahme, dass Feedback kein eindimensionales, 
sondern ein komplexes, multidimensionales Konstrukt darstellt (Brooks et al., 2019; 
Hattie & Timperley, 2007; Strijbos et al., 2021). In den Analysen der vorliegenden 
Arbeit wurde daher zwischen vier unterschiedlichen Dimensionen der Feed- 
backqualität Ergebnisorientierung, Prozessorientierung, Selbstregulationsorientierung und Dia- 
logorientierung differenziert. 

Ergänzend zu den Befunden der konfirmatorischen Faktorenanalysen zur fak- 
toriellen Struktur der wahrgenommenen Feedbackqualität wiesen die Ergebnisse 
auch auf hohe Korrelationen zwischen den einzelnen Dimensionen der Feed- 
backqualität hin (vgl. auch Willems & Dreiling, 2022), wobei die höchsten Zusam- 
menhänge zwischen der ergebnis- und prozessorientierten Dimension sowie zwi- 
schen der prozess- und selbstregulationsorientierten Dimension bestehen. Aus in- 
haltlicher Sicht könnten die hohen Zusammenhänge darin begründet liegen, dass 
Lehrkräfte in der Unterrichtspraxis zeitgleich unterschiedliche Dimensionen von 
Feedback an die Schülerinnen und Schüler adressieren und beispielsweise mit einem 
Feedback zum Ergebnis der Aufgabenbearbeitung (Ergebnisorientierung) begin- 
nen, um daran anschließend ein Feedback zum Prozess der Aufgabenbearbeitung 
(Prozessorientierung) zu erteilen. Diese Praxis spiegelt sich auch empirisch in Vide- 
ostudien wider: Neben dem Befund, dass einfaches bzw. ergebnisorientiertes Feed- 
back am häufigsten erteilt wird, zeigen die Analysen auch, dass in mehreren Fällen 
eine Kombination aus Feedback zum Ergebnis und zum Prozess der Aufgabenbe- 
arbeitung vorkommt (Lotz, 2016). 

Die geringsten Zusammenhänge zeigten sich zwischen der dialogorientierten 
Dimension und den anderen drei Dimensionen, was den theoretischen Ansatz be- 
kräftigt, dass auf dieser Ebene von Feedback der Fokus auf dem Feedbackdialog 
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zwischen der Lehrkraft mit der gesamten Klasse sowie zwischen den peers unterei- 
nander liegt (Orsmond et al., 2013), während auf den anderen Ebenen der Feed- 
backgestaltung der Fokus auf dem Feedbackdialog zwischen der Lehrkraft mit dem 
einzelnen Schüler bzw. der einzelnen Schülerin liegt. 


Messinvarianz im Längsschnitt und im Multigruppenvergleich 


Um die Vergleichbarkeit des Feedbackkonstrukts im Längsschnitt (Tedfragestellung 
7b) und im Multigruppenvergleich (Teifragestellung 10) zu sichern, wurden die Feed- 
backskalen anschließend hinsichtlich ihrer Messinvarianz überprüft. Die längs- 
schnittlichen konfirmatorischen Faktorenanalysen ergaben, dass für die identifi- 
zierte Faktorstruktur der wahrgenommenen Feedbackqualität starke faktorielle 
Messinvarianz über die Geschlechtergruppen sowie über die Messzeitpunkte hin- 
weg angenommen werden kann. Dies bedeutet, dass sich die Messeigenschaften des 
Konstrukts zwischen den Messzeitpunkten nicht verändert haben und sich auch 
zwischen den Geschlechtergruppen nicht unterscheiden, sodass Mittelwerte, Vari- 
anzen und Regressionskoeffizienten in Bezug auf die Feedbackqualität miteinander 
verglichen werden können. 


Geschlechtsspezifische Wahrnehmungen 


Im Multigruppenvergleich konnten keine geschlechtsspezifischen Unterschiede in 
der Wahrnehmung der Feedbackqualität nachgewiesen werden. Schülerinnen und 
Schüler im Deutschunterricht der gymnasialen Oberstufe nehmen somit — unab- 
hängig von ihrem Geschlecht — die Feedbackqualität in gleicher Weise wahr. Damit 
entsprechen die Befunde nicht den Ergebnissen vorangegangener Studien, die ge- 
schlechtsspezifische Unterschiede in der Wahrnehmung von Feedback im 
(Deutsch-) Unterricht nachweisen konnten (Carvalho ct al., 2014; Chen et al., 2011; 
Havnes et al., 2012; Hoya, 2021; Sortkzr, 2018, 2019). Die divergierenden Befunde 
könnten zum einen auf Unterschiede in der Operationalisierung von Feedback zu- 
rückgeführt werden. Während in dieser Arbeit leistungsbezogene Dimensionen der 
Feedbackqualität erfasst wurden, differenzierten die Studien von Hoya (2021) und 
Chen et al. (2011) zwischen positivem Feedback in Form von Lob der Leistungen 
oder des Verhaltens und negativem Feedback in Form von Ablehnung einer er- 
brachten Leistung oder eines Verhaltens. Diese Form der affektiven Tönung wurde 
in der vorliegenden Arbeit hingegen nicht berücksichtigt. Hinweise dafür, dass es 
geschlechtsspezifische Unterschiede in der Wahrnehmung von positivem und ne- 
gativem Feedback gibt, aber nicht in der Wahrnehmung von leistungsbezogenen 
Dimensionen der Feedbackqualität, liefert die Studie von Denn et al. (2015). Aller- 
dings handelt es sich um eine Videostudie, die zwar die Beschreibung der von außen 
beobachteten Feedbackgestaltung zulässt, aber keine Einblicke in die Innensicht der 
Schülerinnen und Schüler erlaubt. 

Insgesamt konnten mit den vorliegenden Befunden keine Unterschiede in der 
Wahrnehmung der Feedbackqualität durch das Geschlecht der Schülerinnen und 


158 Zusammenfassung und Diskussion der Ergebnisse 


Schüler erklärt werden, sodass die Frage aufkommt, ob Wahrnehmungsunter- 
schiede stärker durch individuelle (kognitive und motivational-affektive) Lernvor- 
aussetzungen erklärt werden können (vgl. Hoya, 2021). Erste Hinweise dahinge- 
hend liefert die Untersuchung von Willems und Dreiling (2022), in der nachgewie- 
sen werden konnte, dass Schülerinnen und Schüler mit günstigen motivationalen 
Lernvoraussetzungen die Feedbackqualität höher einschätzen als jene mit ver- 
gleichsweise ungünstigen motivationalen Lernvoraussetzungen. 


Differenzielle Veränderung der Feedbackwahrnehmung 


Ausgehend von den deskriptiven Befunden (vgl. Abschnitt 7.3.1) liegt im Deutsch- 
unterricht der Oberstufe eine hohe Feedbackqualität vor. Vergleichbare Befunde 
zur (wahrgenommenen) Feedbackqualität im Deutschunterricht der Oberstufe sind 
bislang nicht vorhanden. In Studien zur (objektiven) Feedbackgestaltung in den un- 
teren Jahrgangsstufen wurde deutlich, dass einfache Formen von Feedback im Un- 
terricht häufiger erteilt werden als elaborierte (Denn et al., 2015; Krammer et al., 
2010; Lotz, 2016; Pohlmann-Rother et al., 2020). Währenddessen erhalten Schüle- 
rinnen und Schüler der Oberstufe diesen Befunden zufolge häufig auch elaborierte 
Formen des Feedbacks. Dies könnte auch insgesamt die Bedeutung der Schülerper- 
spektive stärken, die durchaus von der objektiveren Perspektive auf die Feedback- 
gestaltung abweichen kann (vgl. dazu auch Hoya, 2019). Denn während videoba- 
sierte Untersuchungen Einblicke in die tatsächlich vorliegende Feedbackgestaltung 
der Lehrkraft geben, können Schülerwahrnehmungen systematisch Aufschluss dar- 
über geben, wie das Feedback bei den Adressatinnen und Adressaten wirklich an- 
kommt und wie diese es für den Lernprozess verarbeiten (Willems & Dreiling, 
2022). 

Für die weiterführende Frage nach der Veränderung der Feedbackwahrneh- 
mung im Laufe des Schulhalbjahres wurden Latent-True-Change-Analysen durch- 
geführt (vgl. Abschnitt 7.3.2). Hier zeigten sich signifikante Mittelwertveränderun- 
gen in der Wahrnehmung der ergebnis-, selbstregulations- und dialogorientierten 
Dimension der Feedbackqualität. Im Einzelnen nahm die wahrgenommene Aus- 
prägung von Feedback zum Ergebnis im Laufe der Schulzeit ab, während die Aus- 
prägungen von selbstregulationsorientiertem und dialogorientiertem Feedback zu- 
nahmen. Beim Blick auf die einzelnen Mittelwerte zum ersten und zweiten Mess- 
zeitpunkt im Latent-State-Modell fiel aber auf, dass die Mittelwertunterschiede al- 
lenfalls gering ausfallen; für die prozessorientierte und selbstregulationsorientierte 
Dimension sind die mittleren Ausprägungen nahezu konstant geblieben. Ver- 
gleichsweise stärker fiel die Veränderung der Wahrnehmung der ergebnisorientier- 
ten (AMW21 = -0.10) und dialogorientierten Dimension (AMW 2.1 = 0.10) aus. Die 
wahrgenommene Feedbackqualität kann sich im Laufe der Sekundarstufe II somit 
verändern. Dieser Befund korrespondiert zum Teil mit den Ergebnissen der Studie 
von De Wit et al. (2010), die eine Veränderung der wahrgenommenen Unterstüt- 


Zusammenfassung der zentralen Befunde 159 


zung beim Übergang in die Oberstufe beschreiben. Die Annahme, dass die wahr- 
genommene Feedbackqualität nach einem Schulhalbjahr sinkt (Hypothese H1d-1), 
konnte nur teilweise bestätigt werden. Eine Abnahme der Feedbackqualität ließ sich 
lediglich für die ergebnisorientierte Dimension feststellen. Tendenziell nahm die 
wahrgenommene Feedbackqualität etwas zu (selbstregulations- und dialogorien- 
tierte Dimension) oder veränderte sich nicht bedeutsam (prozessorientierte Dimen- 
sion). 

Gleichzeitig belegten die Befunde aber auch, dass die Veränderungen nicht für 
alle Schülerinnen und Schüler gleichermaßen ausfallen. Im Einzelnen konnte mit 
den Latent-True-Change-Analysen nachgewiesen werden, dass sich die Schülerin- 
nen und Schüler im Deutschunterricht der gymnasialen Oberstufe nicht nur bedeut- 
sam in der Wahrnehmung von Feedback zu Beginn des Schuljahres, sondern auch 
in ihrer Veränderung im Verlauf des Schulhalbjahres unterscheiden. Somit bestätigt 
sich die Annahme, der zufolge Schülerinnen und Schüler das Feedback nicht in 
gleicher Weise wahrnehmen und sich unterschiedlich in ihrer Wahrnehmung ver- 
ändern (Hypothese 1d-2). Differenzielle Wahrnehmungs- und Veranderungsprozesse 
von Unterrichtsmerkmalen sind aufgrund von individuellen Merkmalen der Schü- 
lerinnen und Schüler sowie Merkmalen der Lernsituation zu erwarten und bestäti- 
gen auch vorangegangene Studienbefunde, die darauf verweisen, dass Schülerinnen 
und Schüler ihre Lernumwelt und dementsprechend auch die Qualität des Feed- 
backs ihrer Lehrkraft unterschiedlich wahrnehmen (Igler et al., 2019; Jurik et al., 
2015; Ruelmann et al., 2021; Schenke et al., 2018; Willems, 2022a; Willems & Drei- 
ling, 2022). 

Um interindividuelle Unterschiede in den Ausgangswerten der Wahrnehmung 
zu Beginn des Schuljahres und in der Veränderung der Wahrnehmung im Schul- 
halbjahr zu erklären, wurden in einem nächsten Schritt das Geschlecht und die 
Deutschnote (Leistungsindikator) als Prädiktoren in das LTC-Modell aufgenom- 
men. Entgegen den Erwartungen (Hypothese HTe-2) konnten — ähnlich wie in den 
Untersuchungen von Reddy et al. (2003) und Way et al. (2007) — keine Effekte des 
Geschlechts und der Deutschnote auf interindividuelle Unterschiede in der intrain- 
dividuellen Veränderung der Feedbackwahrnehmung nachgewiesen werden. Aller- 
dings erwies sich die Deutschnote prädiktiv für Wahrnehmungsunterschiede im 
Ausgangsniveau von ergebnisorientiertem, prozessorientiertem, selbstregulationso- 
rientiertem und dialogorientiertem Feedback (Hypothese H1e-1). Den Befunden zu- 
folge nehmen Schülerinnen und Schüler mit einer besseren Note wahr, dass sie 
diese Formen von Feedback häufiger erhalten als Schülerinnen und Schüler mit ei- 
ner schlechteren Note im Fach Deutsch. Interessant an diesem Ergebnis ist außer- 
dem, dass nach Finbezug der Deutschnote auch der Einfluss des Geschlechts auf 
Wahrnehmungsunterschieden im selbstregulationsorientierten und dialogorientier- 
ten Feedback zu Beginn des Schuljahres signifikant wurde. Im Vergleich zu Schü- 
lern berichten Schülerinnen demzufolge von einer geringeren Ausprägung des 
selbstregulationsorientierten und dialogorientierten Feedbacks. Denkbar wäre, dass 
es sich hier um einen Interaktionseffekt von Leistung und Geschlecht handelt: 
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Möglicherweise ist der Einfluss des Geschlechts unterschiedlich, je nachdem, ob es 
sich um leistungsschwache oder leistungsstarke Schülerinnen und Schüler handelt. 
Hoya (2021) belegt in seiner Studie signifikante Effekte des Geschlechts und der 
Leistung auf die Wahrnehmung von Feedback, allerdings kann er keine signifikan- 
ten Interaktionseffekte nachweisen. 

Insgesamt bestätigen sich die Befunde vorangegangener Studien, die auf Unter- 
schiede in der Unterrichtseinschätzung in Abhängigkeit des Leistungsniveaus hin- 
weisen (Igler et al., 2019; Hoya, 2021; Jurik et al., 2015; Sortker, 2018; Wagner, 
2008). Insbesondere der von Hoya (2021) nachgewiesene Befund, dass Wahrneh- 
mungsunterschiede im erteilten Feedback stärker über die Leistung (und die Moti- 
vation) der Schülerinnen und Schüler und weniger über ihr Geschlecht erklärt wer- 
den können, bestätigt sich hier (vgl. auch Willems & Dreiling, 2022). Während in 
der vorliegenden Arbeit eine höhere Leistung mit einer höheren Feedbackwahrneh- 
mung zusammenhing, ging in den Untersuchungen von Sortkaer (2018, 2019) um- 
gekehrt eine geringere Leistung der Schülerinnen und Schüler mit einer höheren 
Ausprägung des wahrgenommenen Feedbacks einher, weshalb hier die Vermutung 
nahe lag, dass leistungsschwächere Schülerinnen und Schüler mehr Unterstützung 
in Form von Feedback erhalten. Mögliche methodische Ursachen für die unter- 
schiedlichen Befunde könnten in der Operationalisierung von Feedback (als eindi- 
mensionales versus mehrdimensionales Konstrukt) sowie im Kontext der Studien 
(naturwissenschaftlicher Unterricht in der Sekundarstufe I versus Deutschunter- 
richt in der Sekundarstufe II) liegen. Aus inhaltlicher Sicht wäre ein möglicher 
Grund für die divergenten Befunde, dass in den Analysen von Sortkaer (2018, 2019) 
die wahrgenommene Häufigkeit von Feedback im Unterricht im Fokus stand, wäh- 
rend in der vorliegenden Arbeit die Wahrnehmung der Feedbackqualität im öffent- 
lichen Unterrichtsgespräch erhoben wurde. Eine mögliche Begründung für den Be- 
fund, dass Schülerinnen und Schüler mit einer besseren Deutschleistung eine hö- 
here Ausprägung von Feedback im Unterrichtsgespräch wahrnehmen, könnte sein, 
dass Schülerinnen und Schüler in Abhängigkeit von ihrer jeweiligen Leistung das- 
selbe Feedback unterschiedlich verarbeiten und bestimmten Formen von Feedback 
mehr Aufmerksamkeit widmen. Eine andere Erklärung wäre, dass Schülerinnen 
und Schüler im Unterrichtsgespräch tatsächlich ein interindividuell unterschiedli- 
ches Unterrichtsangebot erhalten (vgl. Decristan et al., 2020). Dies könnte zum ei- 
nen darauf hinweisen, dass Lehrkräfte das Feedback im Sinne eines adaptiven Un- 
terrichtshandelns an die Voraussetzungen der Schülerinnen und Schüler anpassen 
(Willems & Dreiling, 2022). Für den Kontext des Unterrichtsgesprächs ist zum an- 
deren plausibel anzunehmen, dass die differenziellen Wahrnehmungen in Abhän- 
gigkeit der Leistung die unterschiedliche Beteiligung der Schülerinnen und Schüler 
am Unterrichtsgespräch widerspiegeln (vgl. Decristan et al., 2020). Wenn sich bei- 
spielsweise leistungsstarke Schülerinnen und Schüler aktiver am Unterrichtsge- 
spräch beteiligen, erhalten sie vermutlich auch häufiger Feedback von der Lehrkraft 
auf ihre Beiträge, was sich wiederrum in den differenziellen Wahrnehmungen nie- 
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derschlägt. Entsprechende empirische Belege finden sich in Studien, die nachwei- 
sen, dass leistungsstärkere Schülerinnen und Schüler häufiger am Unterrichtsge- 
spräch beteiligt sind als ihre Mitschülerinnen und Mitschüler (Decristan et al., 2020; 
Jurik et al., 2013; Pielmeier et al., 2018). Anhand der Analysen von Jurik et al. (2014) 
zeigte sich außerdem, dass das Feedback der Lehrperson — als ein zentrales Merkmal 
des Unterrichtsgesprächs — die kognitiven Lernaktivitäten und die intrinsische Lern- 
motivation der Schülerinnen und Schüler positiv vorhersagte und das insbesondere 
Lernende mit einem „starken“ Profil (hoch ausgeprägte kognitive und motivational- 
affektive Lernvoraussetzungen) über höhere kognitive Lernaktivitäten und eine hö- 
here intrinsische Lernmotivation berichteten. Offensichtlich profitieren Schülerin- 
nen und Schüler also unterschiedlich vom Feedback der Lehrkraft im Unterrichts- 
gespräch in Abhängigkeit ihrer individuellen Lernvoraussetzungen. Vor diesem 
Hintergrund erscheint es für Lehrkräfte umso wichtiger, im Unterricht unterschied- 
liche Gelegenheiten für die aktive, verbale Beteiligung — auch von Schülerinnen und 
Schülern mit ungünstigen Lernvoraussetzungen — zu schaffen, damit alle Lernenden 
gleichermaßen Feedback erhalten und davon profitieren können (vgl. auch Jurik et 
al., 2014). 


8.1.2 Zusammenhänge zwischen Feedback und Lernmotivation 


In der Mehrzahl der Studien stand die Wirkung von Feedback auf kognitive und 
motivationale Merkmale im Fokus der Untersuchung. Basierend auf konzeptuellen 
Annahmen von Angebots-Nutzungs-Modellen (Lipowsky, 2020; Vieluf et al., 2020) 
und aufgrund jüngster Forschungsbefunde (Ruelmann et al., 2021; Willems & Drei- 
ling, 2022) wurde aber davon ausgegangen, dass nicht nur Feedback auf die moti- 
vationalen Merkmale von Schülerinnen und Schülern wirkt, sondern auch die Wahr- 
nehmung von Feedback durch die individuellen motivationalen Eingangsvorausset- 
zungen beeinflusst wird. Das Kernanliegen der vorliegenden Arbeit bestand daher 
darin, Wechselwirkungen von Unterrichtswahrnehmungen (Feedbackqualität) und 
der Motivation von Schülerinnen und Schülern zu untersuchen. Mit der Erfor- 
schung dieser reziproken Prozesse sollte ein Beitrag zur Überprüfung zentraler kon- 
zeptueller Annahmen des Angebots-Nutzungs-Modells geleistet werden. Somit er- 
weitert die vorliegende Untersuchung den Forschungsstand zum Zusammenspiel 
der beiden Konstrukte über die Zeit, indem aus methodischer Sicht eine Längs- 
schnittanalyse auf latenter und damit messfehlerbereinigter Ebene durchgeführt 
wurde. 

Ausgangspunkt der Hauprforschungsfrage II war zunächst die Spezifikation eines 
separaten Latent-True-Change-Modells für die Analyse der Veränderung der intrin- 
sischen Lernmotivation (vgl. Kapitel 7.4.5) im Verlauf eines Schulhalbjahres. Die 
Analysen zeigten im Detail, dass die durchschnittliche intrinsische Lernmotivation 
der Schülerinnen und Schüler im Deutschunterricht der Oberstufe vom ersten zum 
zweiten Messzeitpunkt signifikant abnahm. Damit können die Ergebnisse der 
Oberstufenstudie von Spinath und Steinmayr (2012), die von einer Stabilität der 
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durchschnittlichen Motivation für das Lernen im Fach Deutsch berichten, nicht 
bestätigt werden. Allerdings bezogen sich die Ergebnisse von Spinath und Stein- 
mayr auf die Entwicklung der mittleren Ausprägung der intrinsischen Motivation. 
Die LTC-Analyse der vorliegenden Arbeit erbrachte auch Belege für differenzielle 
Ausgangslagen und Entwicklungsverläufe der intrinsischen Lernmotivation. Die 
Oberstufenschülerinnen und -schüler unterscheiden sich nicht nur bedeutsam im 
Ausgangsniveau ihrer intrinsischen Lernmotivation zu Beginn des Schuljahres, son- 
dern auch in ihrer Veränderung im Verlauf des Schulhalbjahres, d.h. die Entwick- 
lung der intrinsischen Motivation (bzw. die Abnahme) vollzieht sich nicht bei allen 
Schülerinnen und Schülern gleichermaßen. Diese differenziellen Entwicklungen der 
Motivation bei Oberstufenschülerinnen und -schülern im Deutschunterricht konn- 
ten in ähnlicher Weise bereits mittels eines personenzentrierten Untersuchungsan- 
satzes von Dreiling und Willems (2022) nachgewiesen werden. Vergleichbare Un- 
tersuchungsergebnisse finden sich in Bezug auf den Deutschunterricht im Primar- 
bereich (Weidinger et al., 2015). 

Vertiefende Analysen zu den Merkmalen, die interindividuelle Unterschiede in 
der Veränderung der intrinsischen Lernmotivation beeinflussen, erbrachten einen 
signifikant negativen Effekt der Deutschnote: Demzufolge fiel die Abnahme der 
Motivation im Schulhalbjahr bei leistungsstarken Schülerinnen und Schülern stärker 
aus als bei leistungsschwachen Schülerinnen und Schülern. Ein Effekt des Ge- 
schlechts auf Unterschiede in der Motivationsveränderung konnte in dieser Studie 
jedoch nicht nachgewiesen werden. Auch Weidinger et al. (2015) berichten in ihrer 
Untersuchung von einem direkten Effekt der Deutschnote auf die Veränderung der 
intrinsischen Motivation im Deutschunterricht der Primarstufe. Allerdings fiel der 
Effekt — wie in dieser Studie auch — nur gering aus, was darauf hindeutet, dass No- 
ten allenfalls eine untergeordnete Rolle in der Erklärung differenzieller Entwicklun- 
gen der intrinsischen Motivation — auch im Deutschunterricht der Oberstufe — spie- 
len (vgl. Weidinger et al., 2015) und dass andere Faktoren eine höhere Bedeutsam- 
keit aufweisen. 

Für die Kernforschungsfrage dieser Studie nach dem Zusammenhang zwischen 
der Feedbackwahrnehmung und der intrinsischen Lernmotivation sowie den Ver- 
änderungen der Konstrukte über die Zeit wurden im nächsten Schritt bivariate La- 
tent-True-Change-Modelle berechnet und folgende Pfade spezifiziert: (a) Zusam- 
menhänge zwischen den Ausgangswerten der beiden Konstrukte zu Beginn des 
Schuljahres, (b) Zusammenhänge zwischen den parallelen Veränderungen der Kon- 
strukte im Schulhalbjahr sowie (c) prädiktive Effekte des Ausgangswerts eines Kon- 
strukts auf die Veränderung des jeweils anderen Konstrukts im Schulhalbjahr 
(kreuzverzögerte Effekte). Hinsichtlich der Tei/fragestellung F2a zeigten die Ergeb- 
nisse, dass die wahrgenommenen Ausprägungen der Dimensionen der Feed- 
backqualität und die Ausgangsmotivation zu Beginn des Schuljahres positiv korre- 
lieren. Das bedeutet, dass eine höhere Ausprägung der Feedbackqualität mit einer 
höheren intrinsischen Lernmotivation einhergeht und umgekehrt. Hypothese 2a-1 
konnte somit bestätigt werden. Auch die Veränderungen standen in einem moderat 
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positiven Zusammenhang. Eine Veränderung in der Wahrnehmung der Feed- 
backqualität geht demnach mit einer Veränderung der intrinsischen Lernmotivation 
im Verlauf des Schulhalbjahres einher und umgekehrt. Entsprechend konnte Hypo- 
these 2a-2 ebenso bestätigt werden. Die Befunde erweitern den bisherigen For- 
schungsstand zum dynamischen Zusammenspiel von Veränderungsprozessen der 
Unterrichtswahrnehmung und der individuellen Motivation von Schülerinnen und 
Schülern (Lazarides et al., 2019; Maulana et al., 2016; Ruzek & Schenke, 2019). Sie 
stützen zudem die theoretischen Annahmen der Selbstbestimmungstheorie, wo- 
nach eine Veränderung der Lernumgebung (hier: Feedback der Lehrkraft) die Ent- 
wicklung der intrinsischen Lernmotivation beeinflusst (Deci & Ryan, 2000; Deci et 
al., 1999, 2001; Ryan & Deci, 2000). Im Sinne einer reziproken Beziehung von An- 
gebot und Merkmalen der Lernenden (u.a. Lipowsky, 2020; Vieluf et al., 2020), kann 
umgekehrt eine hohe intrinsische Lernmotivation dazu führen, dass die Qualität des 
Feedbacks von den Schülerinnen und Schülern positiver eingeschätzt wird (Ruel- 
mann et al., 2021; Willems & Dreiling, 2022). 

Allerdings kann aufgrund der korrelattven Befunde noch nicht auf gerichtete 
Beziehungen zwischen den Merkmalen geschlossen werden. Obschon die Kon- 
strukte bzw. deren Veränderungen bedeutsam miteinander korrelieren, konnten 
hinsichtlich der Teilfragestellung F2b nicht für alle Feedbackdimensionen signifi- 
kante kreuzverzögerte Effekte nachgewiesen werden. Im Einzelnen konnten keine 
direkten Effekte der Ausgangswerte der ergebnis- und prozessorientierten Dimen- 
sionen auf die spätere Veränderung der Lernmotivation im Schulhalbjahr beobach- 
tet werden. Demgegenüber zeigten sich (geringe) negative Effekte der Ausgangs- 
werte der selbstregulationsorientierten und dialogorientierten Feedbackdimension 
auf die spätere Veränderung der intrinsischen Lernmotivation. Somit konnte Hypo- 
these 2b-1 nur teilweise bestätigt werden. Da die intrinsische Lernmotivation im Mit- 
tel abnimmt, wäre der negative Koeffizient so zu interpretieren, dass eine höher 
ausgeprägte Wahrnehmung des selbstregulations- und dialogorientierten Feedbacks 
zu Beginn des Schuljahres zu einem stärkeren Rückgang der intrinsischen Lernmo- 
tivation im Laufe des Schulhalbjahres führt. Dieser Befund erscheint zunächst wi- 
dersprüchlich, da aus motivationspsychologischer Sicht und aufgrund empirischer 
Befunde (vgl. Abschnitt 3.4) zu erwarten wäre, dass sich eine hohe wahrgenommene 
Qualität von Feedback (im Sinne einer Selbstregulations- und Dialogorientierung) 
positiv auf die Veränderung der intrinsischen Lernmotivation auswirkt. Aus metho- 
discher Sicht könnten die negativen Effekte von der Feedbackwahrnehmung auf 
die Veränderung der Motivation ein Hinweis für einen methodischen Artefakt sein: 
Durch diese Art der Veränderungsmodellierung würde bei geringen zeitübergrei- 
fenden Zusammenhängen — wie es hier der Fall war — fälschlicherweise ein signifi- 
kanter Effekt aufgezeigt werden (Christoph et al., 2014; Steyer et al., 2000). Die 
negativen Effekte auf die Veränderung der intrinsischen Lernmotivation sind daher 
mit Vorsicht zu interpretieren. Eher ist davon auszugehen, dass die wahrgenom- 
mene Qualität von Feedback die Motivationsveränderung nicht direkt beeinflusst. 
Es könnte vielmehr darauf ankommen, wie das Feedback im weiteren Prozess von 
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den Schülerinnen und Schülern verarbeitet wird — ob es beispielsweise als nützlich 
wahrgenommen wird oder ob es das motivationsrelevante Erleben von Kompetenz 
unterstützt (z.B. Hondrich et al., 2018; Rakoczy et al., 2013). Diese Annahmen wur- 
den daher in der Hauptforschungsfrage III überprüft, die Ergebnisse dazu werden im 
nächsten Unterkapitel diskutiert. 

Hinsichtlich der Hypothese 2b-1 konnte ein (geringer) negativer Effekt des Aus- 
gangsniveaus der intrinsischen Lernmotivation auf die Veränderung der Wahrneh- 
mung von prozessorientiertem Feedback — nicht aber auf die Veränderung der an- 
deren Feedbackdimensionen nachgewiesen werden, sodass sich auch diese Hypo- 
these nur teilweise bestätigen ließ. Da die Ausprägung der prozessorientierten Di- 
mension im Mittel zunimmt, war der negative Effekt so zu interpretieren, dass eine 
höhere intrinsische Lernmotivation zu Beginn des Schuljahres mit einer Abnahme 
der Ausprägung einhergeht. Dementsprechend führt eine geringere intrinsische 
Motivation bei Schülerinnen und Schülern zu einer stärkeren Zunahme von wahr- 
genommen prozessorientierten Feedback. Während also zu Beginn des Schuljahres 
eine höhere Motivation (und höhere Deutschleistung, vgl. Abschnitt 7.3.3) mit einer 
positiveren Wahrnehmung von (prozessorientiertem) Feedback einhergeht, zeich- 
net sich nach einem Schulhalbjahr ein anderer Trend ab: Es scheint, dass Lehrkräfte 
den wenig motivierten Schülerinnen und Schülern — die im Durchschnitt auch eine 
geringere Deutschleistung aufweisen — im Laufe des Schulhalbjahres mehr (prozess- 
orientiertes) Feedback erteilen. Diese benötigen im Unterricht möglicherweise 
mehr Unterstützung in Form von präzisen Hinweisen und Strategien zur Bearbei- 
tung einer Lernaufgabe bzw. Beantwortung einer Frage als ihre hoch motivierten 
(und leistungsstarken) Mitschülerinnen und -schüler (Sortkaer, 2019). Einschrän- 
kend ist allerdings festzuhalten, dass insgesamt nur geringe kreuzverzögerte Effekte 
festgestellt werden konnten. Dies lässt darauf schließen, dass die Effekte nur wenig 
zusätzliche Varianz in der Veränderung der intrinsischen Lernmotivation bzw. der 
Feedbackwahrnehmung erklären können. 

Die geringen oder zum Teil ausgebliebenen kreuzverzögerten Effekte in der 
vorliegenden Studie können möglicherweise auf den in der Studie gewählten Zeit- 
intervall von einem halben Schuljahr zwischen den beiden Messzeitpunkten zurück- 
zuführen sein. In früheren Studien wurde die Entwicklung der Motivation im Zeit- 
raum von einem Schuljahr betrachtet (z.B. Spinath & Steinmayr, 2012). Denkbar 
wäre aber auch, dass der hier gewählte Zeitraum zu lang ist, um reziproke Entwick- 
lungszusammenhänge zwischen Unterrichtswahrnehmungen und der Motivation 
von Schülerinnen und Schülern nachweisen zu können. Um diese Frage zu klären, 
bedarf es zukünftig mehr längsschnittlicher Studien, die Einschätzungen der Schü- 
lerinnen und Schüler zur Unterrichtsqualität und ihrer Motivation zu mehreren 
Messzeitpunkten erheben und kürzere Zeitabstände zwischen den einzelnen Mes- 
sungen realisieren (z.B. Patall et al., 2018; Rakoczy et al., 2022). Bei mehr als zwei 
Messzeitpunkten ist es zudem möglich, gezielte Hypothesen über die Form der Ver- 
änderung zu testen (z.B. lineare oder nicht lineare Veränderung) (Dietrich, 2019). 
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81.3 Indirekte Effekte von Feedback auf die Lernmotivation 


Die Hauptforschungsfrage III fokussierte auf indirekte Effekte der Dimensionen der 
Feedbackqualität auf die Veränderung der intrinsischen Lernmotivation. Dabei 
wurden zwei Mediatorvariablen der individuellen Nutzung aufgenommen: die 
wahrgenommene Nützlichkeit von Feedback und das subjektive Kompetenzerle- 
ben. Diese ließen sich wie folgt theoretisch begründen: Damit Feedback lernwirk- 
sam sein kann, muss es von den Lernenden zunächst in seiner Ausprägung wahr- 
genommen und als nützlich bewertet werden, um angemessene kognitive, motiva- 
tional-affektive und verhaltensbezogene Reaktionen hervorzurufen (Lipnevich et 
al., 2016; Lipnevich & Panadero, 2021; Rakoczy et al., 2013; Rakoczy et al., 2019; 
Strijbos et al., 2010; Strijbos et al., 2021). Vor dem Hintergrund der Selbstbestim- 
mungstheorie wirkt sich ein Feedback, dass informierend gestaltet ist und das Kom- 
petenzerleben von Lernenden unterstützt, positiv auf die intrinsische Motivation 
aus. In Anlehnung an theoretische Angebots-Nutzungs-Modelle (Klieme & Ra- 
koczy, 2008; Seidel, 2014; Vieluf et al., 2020) kann das motivationsrelevante Erleben 
von Kompetenzunterstützung als Indikator der individuellen Nutzung des Lernan- 
gebots betrachtet und methodisch als Mediatorvariable in die Analyse der Wir- 
kungsweise von Feedback einbezogen werden (Jansen et al., 2022; Ledergerber, 
2015; Rakoczy, 2008; Rakoczy et al., 2013; Rakoczy et al., 2022; Willems, 2011). 
Die Mediationsanalysen bestätigten diese theoretischen Annahmen. Im Einzel- 
nen zeigte sich in Bezug auf die Hyporhese 3a, dass — auch unter Kontrolle der Deut- 
schleistung und des Geschlechts der Schülerinnen und Schüler — höhere Ausprä- 
gungen in den Dimensionen der Feedbackqualität zu Beginn des Schuljahres mit 
einer höheren Ausprägung in der wahrgenommenen Nützlichkeit einhergingen, die 
sich wiederum positiv auf die Veränderung der intrinsischen Lernmotivation im 
Schulhalbjahr auswirkte. Entsprechend zeigten sich positive indirekte Effekte der 
wahrgenommenen Feedbackqualität auf die Motivationsveränderung, vermittelt 
über die wahrgenommene Nützlichkeit von Feedback. Ein qualitätsvolles Feed- 
back, das von Schülerinnen und Schülern als nützlich wahrgenommen wird, kann 
die Abnahme der intrinsischen Lernmotivation im Deutschunterricht sozusagen ab- 
mildern. Damit stehen die Befunde auch im Einklang mit den Studienergebnissen 
von Rakoczy et al. (2013), Rakoczy et al. (2019) sowie Harks et al. (2014), die anhand 
von Daten aus dem Co2Ca-Projekt positive Effekte der wahrgenommenen Nütz- 
lichkeit von Feedback auf die motivationale Entwicklung und einen positiven indi- 
rekten Effekt von (prozessorientiertem) Feedback auf die motivationale Entwick- 
lung — vermittelt über die wahrgenommene Nützlichkeit — nachweisen konnten. 
Interessant an den dargestellten Befunden dieser Arbeit ist, dass die ergebnis- und 
prozessorientierte Dimension von Feedback stärker mit der wahrgenommenen 
Nützlichkeit korrelieren als mit der selbstregulations- und dialogorientierten Di- 
mension. Denkbar wäre, dass die Schülerinnen und Schüler mit ergebnis- und pro- 
zessotientiertem Feedback vertrauter sind, weshalb diese mit einer höheren Nütz- 
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lichkeit assoziiert sind. Im Kontext der gymnasialen Oberstufe, in der die Schüle- 
rinnen und Schüler auf die Abiturprüfungen vorbereitet werden, kann es nahelie- 
gend sein, dass solche Formen von Feedback, die Informationen in Bezug auf die 
Lernziele (ergebnisorientiert) und spezifische Hinweise zur Verbesserung (prozess- 
orientiert) enthalten, als hilfreicher empfunden werden. 

Des Weiteren konnte auch Hypothese 3b bestätigt werden: So führten höhere 
Ausprägungen in den Dimensionen der Feedbackqualität zu einer positiveren 
Wahrnehmung des subjektiven Kompetenzerlebens, das wiederum die Verände- 
rung der intrinsischen Lernmotivation im Schulhalbjahr positiv beeinflusste. Ent- 
sprechend zeigten sich auch hier positive indirekte Effekte der wahrgenommenen 
Feedbackqualität auf die Motivationsveränderung, vermittelt über das wahrgenom- 
mene Kompetenzerleben. Anders ausgedrückt: Ein qualitätsvolles Feedback, dass 
das Kompetenzerleben von Schülerinnen und Schülern unterstützt, kann die Ab- 
nahme der intrinsischen Lernmotivation im Deutschunterricht abschwächen. Die 
vermittelnde Wirkung des Kompetenzerlebens wurde auch in anderen Studien be- 
reits beschrieben (z.B. Gniewosz et al., 2014; Hondrich et al., 2018; Rakoczy et al., 
2013). Insgesamt wird die motivationsförderliche Wirkung von Feedback als Un- 
terrichtsmerkmal durch die Nutzung mediiert, die in dieser Studie über die wahrge- 
nommene Nützlichkeit von Feedback und das motivationsrelevante Erleben von 
Kompetenz operationalisiert wurde. 

Zusammenfassend wird anhand der dargestellten Befunde deutlich, dass Schülerin- 
nen und Schüler mit günstigeren Lernvoraussetzungen (höhere Leistung und Ein- 
gangsmotivation) die Qualität von Feedback positiver wahrnehmen. Wenn Schüle- 
rinnen und Schüler über eine höhere Ausprägung von qualitätsvollem Feedback be- 
richten, dann geht dies mit einer positiveren Bewertung der Nützlichkeit und einem 
höheren Kompetenzerleben einher, was wiederrum eine positive Motivationsent- 
wicklung begünstigt. In dieser Hinsicht untermauern die Befunde eine differenzielle 
Wahrnehmung (und Nutzung) von Feedback als eine Ursache für differenzielle Mo- 
tivationsentwicklungen. Tabelle 50 fasst die (teilweise) bestätigten oder verworfe- 
nen Hypothesen abschließend zusammen. 
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Tabelle 50: Übersicht über Hypothesen und empirische Befunde der Studie 


Bestä- 
tigt 


Teil- 
weise 
bestä- 
tigt 


Nicht 
bestä- 
tigt 


H1d-1 


Die wahrgenommene Feedbackqualitat sinkt 
über das Schulhalbjahr hinweg. 


H1d-2 


Es zeigen sich interindividuelle Unterschiede 
in der Veränderung der Feedbackwahrneh- 
mung. 


Hle-1 


Das Geschlecht stellt — auch unter Berück- 
sichtigung der Vorleistung — einen relevanten 
Prädiktor differenzieller Feedbackwahrneh- 
mungen dar. 


Hle-2 


H2a-1 


H2a-2 


Das Geschlecht stellt — auch unter Berück- 
sichtigung der Vorleistung — einen relevanten 
Prädiktor interindividueller Unterschiede in 
der Veränderung der Feedbackwahrnehmung 
dar. 

Je höher die wahrgenommene Feedbackqua- 
lität ausgeprägt ist, desto höher ist die intrin- 
sische Lernmotivation. 

Je stärker sich die Feedbackwahrnehmung 
zur Mitte des Schuljahres verändert, desto 
stärker verändert sich die intrinsische Lern- 
motivation. 


H2b-1 


Die wahrgenommene Feedbackqualität zu 
Beginn des Schuljahres sagt die Veränderung 
in der intrinsischen Lernmotivation im Laufe 
des Schulhalbjahres vorher. 


H2b-2 


Die intrinsische Lernmotivation zu Beginn 
des Schuljahres sagt die Veränderung in der 
Wahrnehmung von Feedbackqualität im 
Laufe des Schuljahres vorher. 


H3a 


H3b 


Die wahrgenommene Nützlichkeit von Feed- 
back kann die Wirkung von wahrgenomme- 
ner Feedbackqualität auf die Veränderung 
der intrinsischen Lernmotivation vermitteln 
und erklären. 

Das Kompetenzerleben kann die Wirkung 
von wahrgenommener Feedbackqualität auf 
die Veränderung der intrinsischen Lernmoti- 
vation vermitteln und erklären. 
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8.2 Grenzen der Studie 


Bei der Interpretation der Befunde der vorliegenden Studie sind einige Einschrän- 
kungen zu beachten. 

Zunächst beziehen sich die Ergebnisse auf das Fach Deutsch im Kontext der 
gymnasialen Oberstufe. Offen bleibt beispielsweise, ob sich das Modell der vier Di- 
mensionen von Feedbackqualität auch aus der Sicht von Schülerinnen und Schülern 
in anderen Fächern der gymnasialen Oberstufe abbilden lässt und ob sich die be- 
richteten (indirekten) Zusammenhänge zwischen der wahrgenommenen Feed- 
backqualität und der Motivation von Schülerinnen und Schülern auf andere Kon- 
texte übertragen lassen. Neben dem Fokus auf den Deutschunterricht beziehen sich 
die Einschätzungen zur Feedbackqualität nur auf das öffentliche Unterrichtsge- 
spräch, sodass keine Aussagen über das Feedback der Lehrkraft in anderen Phasen 
des Unterrichts (z.B. Schülerarbeitsphasen) getroffen werden können. Denkbar 
wäre, dass es Unterschiede in der wahrgenommenen Feedbackqualität zwischen 
lehrerzentrierten (z.B. öffentliches Unterrichtsgespräch) und schülerzentrierten 
(z.B. Schülerarbeitsphasen) Unterrichtsphasen gibt, die in dieser Studie allerdings 
nicht adressiert werden konnten. Die Videoanalysen der Studie von Kobarg und 
Seidel (2007) zeigten dahingehend, dass Lehrkräfte sowohl in Phasen des Unter- 
richtsgesprächs als auch in Schülerarbeitsphasen des Physikunterrichts nur selten 
prozessorientiertes Feedback erteilen. 

Zudem gehen mit der hier fokussierten Schülerwahrnehmung Einschränkungen 
bei der Interpretation der Befunde einher. Da es sich um Selbstauskünfte der Schü- 
lerinnen und Schüler handelt, könnten die Befundmuster potenziell über- oder un- 
terschätzt werden. Aufgrund des Erhebungsdesigns bleibt ungeklärt, ob die be- 
schriebenen hohen Ausprägungen der Feedbackdimensionen sowie die empirisch 
nachgewiesenen Wahrnehmungsunterschiede ein Produkt individueller Verarbei- 
tungsprozesse der Schülerinnen und Schüler sind oder die differenzielle Feedback- 
gestaltung der Lehrkraft widerspiegeln (vgl. auch Willems & Dreiling, 2022). 

Eine weitere Limitation dieser Studie ist, dass die einzelnen Dimensionen der 
Feedbackqualität hoch miteinander korrelieren und fraglich ist, ob die Indikatoren 
trennscharf genug sind. Wie den Befunden der Korrelations- und Mediationsanaly- 
sen zu entnehmen ist, scheint es wichtig zu sein zwischen den unterschiedlichen 
Dimensionen zu differenzieren, da sie unterschiedlich mit der motivationalen Ent- 
wicklung der Schülerinnen und Schüler zusammenhängen. Außerdem zeigen sich 
auch unterschiedliche Effekte der Deutschleistung auf die Schülereinschätzungen 
der Feedbackdimensionen, was auch das Argument stärkt, die Feedbackdimensio- 
nen — trotz des hohen Anteils an geteilter Varianz — separat zu erfassen. In vertie- 
fenden Analysen der FeeHe-Daten sollten weitere kognitive und motivational-af- 
fektive Zielkriterien des Unterrichts einbezogen werden, um zu untersuchen, wel- 
che spezifische Vorhersagekraft die Feedbackdimensionen zur Veränderung dieser 
Merkmale haben. 
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Eine weitere Einschränkung betrifft die Modellierung. Das in der vorliegenden 
Arbeit eingesetzte Verfahren der Strukturgleichungsmodellierung bietet gegenüber 
anderen statistischen Analysemethoden (z.B. manifeste Korrelations- oder Pfada- 
nalysen) insbesondere den Vorteil, dass komplexe Zusammenhänge zwischen Va- 
riablen auf latenter und damit messfehlerbereinigter Ebene untersucht werden. 
Auch für Veränderungsmessungen stellen lineare Strukturgleichungsmodelle ein ge- 
eignetes Verfahren dar (vgl. Kapitel 6.6, s. auch Geiser, 2011). Gleichzeitig weisen 
auch Strukturgleichungsmodellierungen Grenzen auf. So ist es mit dieser Analyse- 
methode nur bedingt möglich Annahmen über kausale Beziehungen zwischen Va- 
riablen nachzuweisen. Neben theoretischen Herleitungen im Hinblick auf die ver- 
mutete Wirkungsbeziehung zwischen Variablen ist es darüber hinaus erforderlich, 
dass die unabhängige Variable, die als Ursache angenommen wird, der abhängigen 
Variablen zeitlich vorgelagert ist (Weiber & Mühlhaus, 2014). Diese Bedingung er- 
fordert ein längsschnittliches Design. In der vorliegenden Arbeit wurden diese Vo- 
raussetzungen nur bedingt erfüllt: Die Untersuchung der Wirkungsrichtungen zwi- 
schen der wahrgenommenen Feedbackqualität und der intrinsischen Lernmotiva- 
tion konnte aufgrund der zeitlich wiederholten Erfassung beider Merkmale über die 
Modellierung von bivariaten Latent-Irue-Change-Modellen realisiert werden. 
Dadurch konnten vermutete Wirkungen von einzelnen Dimensionen der Feed- 
backqualität auf die Motivationsentwicklung, aber auch von der intrinsischen Lern- 
motivation als individuelle Lernvoraussetzung auf die Veränderung der wahrge- 
nommenen Feedbackqualität nachgewiesen werden. Für das Mediationsmodell hin- 
gegen, mittels dessen auch Wirkungen der beiden Mediatorvariablen (wahrgenom- 
mene Nützlichkeit und Kompetenzerleben) auf die Motivationsentwicklung über- 
prüft werden sollten, muss einschränkend festgehalten werden, dass die Mediator- 
variablen der Motivationsvariable im Modell nicht zeitlich vorgelagert sind. 
Obschon aufgrund der Selbstbestimmungstheorie davon ausgegangen werden 
kann, dass die Entwicklung einer intrinsischen Motivationsqualität vom Kompe- 
tenzerleben bedingt wird, sind die kausalen Beziehungen hier mit Vorsicht zu inter- 
pretieren. Beispielsweise wäre es auch denkbar, dass Unterschiede in der intrinsi- 
schen Motivation von Schülerinnen und Schülern zu unterschiedlichen Wahrneh- 
mungsprozessen in Bezug auf die Nützlichkeit von Feedback führen können. Letzt- 
lich sind randomisierte Experimentalstudien erforderlich, in denen Störvariablen 
möglichst ausgeschlossen werden und somit Annahmen über kausale Beziehungen 
zwischen Variablen nachgewiesen werden können. 

Eine weitere Einschränkung ist zudem, dass sich die Operationalisierung der 
Lernmotivation auf die intrinsische Motivation beschränkte und die Formen der 
extrinsischen Motivation (external, introjiziert, identifiziert) nicht betrachtet wur- 
den. Außerdem wurde — anknüpfend an vorherige Forschungsbefunde — nur das 
Kompetenzerleben als mögliche motivationsrelevante Mediatorvariable in der Ana- 
lyse der indirekten Wirkungen von Feedback auf die Entwicklung der intrinsischen 
Motivation berücksichtigt. Die mediierende Bedeutung des Autonomieerlebens 
wurde nicht untersucht, obgleich aufgrund bestehender Forschungsbefunde (z.B. 
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Mouratidis et al., 2010) angenommen werden könnte, dass bestimmte Formen der 
Feedbackqualität auch das Autonomieerleben und vermittelt darüber die intrinsi- 
sche Motivation der Schülerinnen und Schüler positiv unterstützen. Diese An- 
nahme sollte insbesondere für die Indikatoren der selbstregulations- und dialogori- 
entierten Dimensionen von Feedbackqualität zukünftig überprüft werden. Indem 
auf diesen Ebenen von Feedback die Verantwortung für die Verbesserung eines 
Schülerbeitrags an die Lernenden selbst übertragen wird, ist anzunehmen, dass das 
Erleben von Autonomie positiv unterstützt wird. 


8.3 Implikationen für die Forschung 


Die Untersuchung leistet einen wichtigen Beitrag zur Theoriebildung, indem Er- 
kenntnisse zum Zusammenspiel von Feedbackwahrnehmung, individueller Nut- 
zung und intrinsischer Lernmotivation gewonnen wurden. Im Folgenden wird dis- 
kutiert, welche weiterführenden Studien sich aus den Ergebnissen dieser Arbeit er- 
geben. 


Modellierung von Feedback 


Ein Ergebnis der vorliegenden Studie ist, dass distinkte Dimensionen der Feed- 
backqualität aus der Sicht von Schülerinnen und Schülern erfasst werden können. 
Allerdings bestehen nach wie vor starke Zusammenhänge zwischen den Dimensi- 
onen der Feedbackqualität im Strukturmodell. Um diese Zusammenhänge besser 
abzubilden, könnten alternative Messmodelle in Betracht gezogen werden, die die 
allgemeine Wahrnehmung bzw. Gesamtbeurteilung der Feedbackqualität (General- 
faktor) von den spezifischen Wahrnehmungen der vier unterschiedlichen Dimensi- 
onen der Feedbackqualität (spezifische Faktoren) trennen. Dies kann in einem Bi- 
faktormodell dargestellt werden (Reise, 2012; Anwendung bei Scherer et al., 2016). 
Mit diesem hierarchischen Modell kann überprüft werden, ob die Items auf einen 
Generalfaktor Feedbackqualtat 1. Ordnung und vier unkorrelierten Faktoren 1. Ord- 
nung laden, die den Dimensionen Ergebnisorientierung, Prozessorientierung, Selbstregulati- 
onsorientierung and Dialogorientierung entsprechen. Hierdurch lässt sich abschätzen, wie 
viel Varianz der Indikatorvariablen durch den Generalfaktor und wie viel Varianz 
durch einen spezifischen Residualfaktor erklärt wird, der unabhängig vom General- 
faktor ist (Gäde, Schermelleh-Engel & Brandt, 2020). Wird ein geringerer Anteil der 
Indikatorvarianz durch den Generalfaktor erklärt als durch einen bestimmten Resi- 
dualfaktor, so wäre bestätigt, dass die Indikatoren besser durch vier eigenständige 
Faktoren (die vier Dimensionen der Feedbackqualität) als durch einen Generalfak- 
tor der Feedbackqualität abgebildet werden können. 

Um die Zusammenhänge im Messmodell als auch die konzeptuellen Überlap- 
pungen von Dimensionen der Unterrichtsqualität abbilden zu können, schlagen 
Scherer et al. (2016) noch eine weitere Form der Modellierung vor, in der Doppel- 
ladungen von Items — also Ladungen eines Items auf mehrere Faktoren — zugelassen 
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werden: Die explorative Strukturgleichungsmodellierung (exploratory structural equa- 
tion modeling, ESEM; vel. Marsh et al., 2014) ist ein alternatives Verfahren zur kon- 
firmatorischen Faktoranalyse. Scherer et al. (2016) erachten die Annahme der kon- 
firmatorischen Faktoranalyse, in der Items eindeutig einem Faktor zugeordnet wer- 
den dürfen, als zu stark. In ihren Analysen zur Dimensionalitat der Unterrichtsqua- 
lität auf Basis von Schülerwahrnehmungen erreichte das ESEM-Modell gegenüber 
dem traditionellen CFA-Modell einen deutlich besseren Modell-Fit. In zukünftigen 
Arbeiten könnten solche alternativen Formen der Modellierung in Bezug auf die 
Feedbackqualität in Betracht gezogen werden. In diesem Zusammenhang könnte 
auch geprüft werden, mit welchen faktoranalytischen Verfahren (traditionelle CFA, 
Bifaktormodell, ESEM) die Effekte der Dimensionen der Feedbackqualität auf die 
Lernergebnisse besser erfasst werden können (vgl. Scherer et al., 2016). 


Feedback im Modell der drei Basisdimensionen 


In der vorliegenden Studie wurde nachgewiesen, dass die Feedbackqualität (aus der 
Sicht der Schülerinnen und Schüler) ein multidimensionales Konstrukt darstellt und 
dass diese — vermittelt über die wahrgenommene Nützlichkeit und das motivations- 
relevante Kompetenzerleben — die Entwicklung der intrinsischen Motivation von 
Schülerinnen und Schülern positiv unterstützt. Für die pädagogisch-psychologische 
Unterrichtsforschung, in der das generische Modell der drei Basisdimensionen zur 
Beschreibung der Unterrichtsqualität weit verbreitet ist (Fauth et al., 2014; Klieme 
et al., 2006; Klieme, 2019; Klieme & Rakoczy, 2008; Praetorius et al., 2018) und die 
darauf basierenden Messinstrumenten stets weiterentwickelt werden, sollte ange- 
sichts dieser Befunde künftig in Betracht gezogen werden, die zentralen Dimensio- 
nen von qualitätsvollem Feedback noch systematischer als bisher in das Modell der 
drei Basisdimensionen einzubeziehen. Zwar sind in einigen Beschreibungen von 
einzelnen Basisdimensionen — wie der konstruktiven Unterstützung oder der kog- 
nitiven Aktivierung — durchaus auch Feedback als Qualitätsmerkmal enthalten (vgl. 
Göllner et al., 2021; Kunter & Trautwein, 2013; Praetorius et al., 2014). Allerdings 
wird Feedback hier eher als eindimensionales Konstrukt behandelt. Dass aber das 
Erteilen von Feedback nicht per se zu größerem Lernerfolg oder Verständnis der 
Lerninhalte bei den Lernenden führt, ist bereits unumstritten. Um die Forschungs- 
befunde dahingehend adäquat abzubilden, erscheint das Aufgreifen von Qualitäts- 
aspekten der Feedbackgestaltung bei der Beschreibung der einzelnen Basisdimensi- 
onen unumgänglich. Beispielsweise könnten unterschiedliche Qualitätsdimensio- 
nen von Feedback als zusätzliche Subdimensionen berücksichtigt werden, indem 
auch elaborierte Aspekte wie Selbstregulations- und Dialogorientierung weiter aus- 
differenziert werden. Um zentrale Dimensionen von Unterrichtsqualität valide zu 
erfassen, könnte zusätzlich darüber nachgedacht werden, Feedback als eigenstän- 
dige Dimension von Unterrichtsqualität im Modell der drei Basisdimensionen ab- 
zubilden, wie das beispielsweise in der Konzeptualisierung von Charalambous und 
Praetorius (2020) geschicht (vgl. auch Praetorius & Gräsel, 2021) und in der Arbeit 
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von Buholzer et al. (2023) in Bezug auf das verwandte Konstrukt Formatives Assess- 
ment nahegelegt wird. In zukünftigen Forschungsarbeiten könnte daran anknüpfend 
untersucht werden, wie Feedback als eigenständige Qualitätsdimension von Unter- 
richtsqualität mit den drei Basisdimensionen zusammenhängt. 


Effekte anf kognitive Zielkriterien 


In der FeeHe-Studie liegen keine Daten zur Entwicklung der Leistungen und Kom- 
petenzen der Schülerinnen und Schüler im Fach Deutsch der Oberstufe vor, sodass 
Wirkungen der wahrgenommenen Dimensionen von Feedbackqualität auf den 
Leistungs- oder Kompetenzzuwachs in der vorliegenden Arbeit nicht untersucht 
werden konnten. Für eine systematische Untersuchung des Modells der vier Feed- 
backdimensionen bedarf es weiterer Studien, die den Zusammenhang der Schüler- 
einschätzungen in Bezug auf die Feedbackqualität mit kognitiven — sowie weiteren 
motivational-affektiven — Zielkriterien von Unterricht differenziert untersuchen, 
und damit die Bedeutung der aus Schülersicht wahrgenommenen Feedbackqualität 
für die Lernprozesse von Schülerinnen und Schüler prüfen. 


Berücksichtigung der Variabilität in der Feedbackwahrnehmung 


Für Forschung im Bereich der Unterrichtswahrnehmung von Lernenden ist rele- 
vant, dass in der vorliegenden Studie bedeutsame interindividuelle Unterschiede in 
der Ausgangswahrnehmung zu Beginn des Schuljahres und in der Veränderung der 
Wahrnehmung von Feedback im Schulhalbjahr gefunden wurden. Ein Hauptergeb- 
nis dieser Studie ist demnach, dass Schülerinnen und Schüler nicht alle gleicherma- 
ßen das Feedback der Lehrkraft wahrnehmen und dass sich ihre Wahrnehmung 
über die Zeit unterschiedlich verändert. Allerdings konnte nur ein geringer Anteil 
der Gesamtvarianz in der differenziellen Wahrnehmung und Veränderung der 
Feedbackqualität erklärt werden. Das heißt, die Deutschleistung und die Eingangs- 
motivation sagten zwar zum Teil signifikante Unterschiede in der Feedbackwahr- 
nehmung oder der Veränderung der Wahrnehmung voraus, aber interindividuelle 
Unterschiede werden zum größten Teil durch andere Faktoren beeinflusst. Es blieb 
also ein erheblicher Anteil an unerklärter Varianz. Zukünftige Forschung könnte 
dieses Desiderat aufgreifen und weitere Prädiktorvariablen untersuchen, die als po- 
tenziell einflussnehmend auf die Wahrnehmung der Qualität von Feedback und de- 
ren zeitliche Veränderung gelten. Aus den theoretischen Ausführungen von Strijbos 
und Müller (2014) ergibt sich, dass Merkmale der Lehrperson (z.B. die wahrgenom- 
men Kompetenz) und weitere kognitive und motivational-affekte Merkmale der 
Lernenden (z.B. Selbstwirksamkeit, Attribution von Erfolg und Misserfolg, motiva- 
tionale Zielorientierungen) Wahrnehmungsunterschiede hervorrufen können. In 
der Studie von Igler et al. (2019) wurden Wahrnehmungsunterschiede in Merkmalen 
der Unterrichtsqualität untersucht und festgestellt, dass insbesondere die individu- 
ellen Schülermerkmale Vorwissen, kognitive Fähigkeiten, motivationale Orientie- 
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rung und emotionale Bindung sowie soziale Herkunft prädiktiv für die Schülerein- 
schätzung hinsichtlich der Unterrichtsqualität sind. Zukünftige Untersuchungen 
könnten den Einfluss dieser Variablen auch auf die Einschätzung der Feedbackqua- 
lität untersuchen. 

Aufgrund der nachgewiesenen Bedeutsamkeit individueller Merkmale und Lern- 
voraussetzungen von Schülerinnen und Schülern für die Wahrnehmung der Feed- 
backqualität muss zukünftige Forschung die Frage klären, wie solche individuellen 
Lernvoraussetzungen in Modellen berücksichtigt werden können, um der Annahme 
differenzieller Wahrnehmungsprozesse und Wirkungsweisen von Feedback noch 
stärker als bisher zu begegnen. Für die Variablen im Modell statistisch zu kontrol- 
lieren, erscheint nicht mehr ausreichend, um die Annahme zu prüfen, für welche 
Schülerinnen und Schüler eine bestimmte Form von Feedback besonders nützlich 
oder wirkungsvoll ist. Anknüpfend an die Studien von Rakoczy et al. (2013) und 
Weidinger et al. (2016) könnten individuelle Merkmale auch als mögliche Moderator- 
variablen in den Analysen berücksichtigt werden. Den Befunden von Rakoczy et al. 
(2013) zufolge wird der Einfluss der Feedbackqualität auf die wahrgenommene 
Nützlichkeit durch die Ausprägung der Lernzielorientierung der Schülerinnen und 
Schüler moderiert. Dementsprechend nehmen lernzielorientierte Schülerinnen und 
Schüler, die bestrebt sind, die Lerninhalte zu verstehen, ein prozessorientiertes 
Feedback als nützlicher wahr als ein sozialvergleichendes Feedback (Rakoczy et al., 
2013). Jüngste Studien im Bereich der personenzentrierten Forschung untersuchen 
die kognitiven und motivational-affektiven Merkmale von Schülerinnen und Schü- 
lern in Form von komplexen Profilen, die sich differenziell auf die Wahrnehmung 
der Unterrichts- und Feedbackqualität auswirken (Ruelmann et al., 2021; Seidel, 
2006; Willems, 2022; Willems & Dreiling, 2022; Willems et al., im Druck). Aufgrund 
dessen könnte weiterführend untersucht werden, inwiefern sich in Abhängigkeit 
dieser Schülerprofile auch differenzielle Wirkungen der Feedbackqualität ergeben. 


Implikationen in Bezug auf das Studiendesign 


Da wechselseitige Einflüsse der wahrgenommenen Feedbackqualität und der Lern- 
motivation im Zeitraum von einem halben Schuljahr in der vorliegenden Arbeit 
nicht oder nur teilweise bestätigt werden konnten, erscheint es für zukünftige For- 
schungsarbeiten relevant, längsschnittliche Studiendesigns durchzuführen, in denen 
mehrere Messzeitpunkte sowie kürzere Zeitintervalle zwischen den Erhebungen der 
Unterrichtswahrnehmung und der Motivation von Schülerinnen und Schülern rea- 
lisiert werden. So berichten Rakoczy ct al. (2022), dass ein bedeutsamer Anteil der 
Varianz in den Einschätzungen der Unterrichtsqualität zwischen den Messzeitpunk- 
ten liegt. In der Studie von Patall et al. (2018) wurde die wahrgenommene Autono- 
mieunterstützung sowie die Motivation und das Verhalten von Schülerinnen und 
Schülern der US-amerikanischen High School täglich während einer naturwissen- 
schaftlichen Unterrichtseinheit erfasst sowie entsprechende Zusammenhänge un- 
tersucht. Die Analysen ergaben, dass die Einschätzungen von Lernenden zwischen 
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verschiedenen Messzeitpunkten variieren. Mittels Mehrebenenanalysen konnten die 
Autoren außerdem reziproke Effekte nachweisen: Zum einen konnten Veränderun- 
gen der selbstbestimmten Motivation und des Verhaltens durch das wahrgenom- 
mene autonomieunterstutzende Unterrichtshandeln vorhergesagt werden, zum an- 
deren beeinflussten auch die Motivation und das Verhalten der Schülerinnen und 
Schüler Veränderungen in ihrer Wahrnehmung des autonomieunterstützenden 
Lehrkraftverhaltens. 

Insgesamt stärken die Befunde das Argument, nicht nur die Variabilität von Un- 
terrichtseinschätzungen zwischen den einzelnen Schülerinnen und Schülern (interin- 
dividuelle Unterschiede), sondern auch zwischen den Messzeitpunkten (¢atraindividu- 
elle Unterschiede) stärker zu berücksichtigen. Vor diesem Hintergrund sind auch 
retrospektiv erfasste und klassenweise aggregierte Urteile über Unterrichtswahrneh- 
mung, Nutzung und Motivation im Kontext mehrebenenanalytischer Auswertun- 
gen kritisch zu hinterfragen (Rakoczy et al., 2022; vgl. hierzu auch kritisch Igler et 
al., 2019; Willems & Dreiling, 2022). Daran anknüpfend sind auch weitere Studien 
notwendig, die untersuchen, in welchem Ausmaß die Variabilität in den Unter- 
richtseinschätzungen durch individuelle Wahrnehmungsprozesse der Schülerinnen 
und Schüler oder differenzielle Angebotsstrukturen im Unterricht entsteht (Ra- 
koczy et al., 2022; vgl. auch Igler et al., 2019; Willems & Dreiling, 2022). Um solche 
Fragen angemessen zu beantworten, erscheint es für die zukünftige Forschung ge- 
winnbringend, die subjektive Erfassung der Schülerperspektive mit einer objektiven 
Beobachtung des unterrichtlichen Handelns zu kombinieren und wechselseitig auf- 
einander zu beziehen. 


8.4 Implikationen für die Praxis 


Ausgehend von den Befunden dieser Untersuchung lassen sich Implikationen so- 
wohl für die pädagogische Praxis als auch für die universitäre Ausbildung von Lehr- 
kräften ableiten. 

Die vorliegende Studie demonstriert die positive, über die wahrgenommene 
Nützlichkeit und das Kompetenzerleben vermittelnde Wirkung von Rückmeldun- 
gen, die spezifische Informationen zum Ergebnis in Bezug auf konkrete Lernziele, 
weiterführende Hinweise zum Lernprozess enthalten und die zur Se/bstregulation des 
Lernprozesses sowie zum Dialog bzw. Austausch mit den Mitschülerinnen und - 
schülern anregen. Die Ergebnisse zeigten außerdem, dass die ergebnis- und pro- 
zessotientierte Dimension von Feedback stärker mit der wahrgenommenen Nütz- 
lichkeit zusammenhängen als mit der selbstregulations- und dialogorientierten Di- 
mension. Denkbar wäre, dass die Schülerinnen und Schüler mit ergebnis- und pro- 
zessotientiertem Feedback vertrauter sind und es deshalb als nützlicher bewerten. 
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Dies ist angesichts der gängigen eher summativen Leistungsbeurteilungspraxis 
(üblicherweise in Form einer am Ende einer Unterrichtseinheit erfolgten Klassen- 
arbeit) nicht verwunderlich: Diese signalisiert Lehrenden sowie Lernenden, dass sie 
einen bestimmten Sollwert erreichen müssen, was zur Verengung von Unterrichts- 
prozessen (Klieme et al., 2010) und damit auch zu einer geringen Bereitschaft zur 
Umsetzung von vergleichsweise zeitintensiveren und voraussetzungsreicheren For- 
men von Feedback führen kann. Aufgrund der nachgewiesenen förderlichen Wir- 
kungen sollte das Potenzial unterschiedlicher Feedbackformen im Unterricht stär- 
ker genutzt werden, indem einerseits Feedback als fester (und von Noten losgelös- 
ter) Bestandteil in den Lehr-Lernprozess eingebunden wird und andererseits auch 
bei einer summativen Feedbackkultur auf eine differenzierte Gestaltung der Rück- 
meldungen geachtet wird (Besser et al., 2017; Klieme et al., 2010). 

In Bezug auf die Praxis zeigen die Ergebnisse, dass es beim Erteilen von Feed- 
back im Unterricht entscheidend darauf ankommt, wie Schülerinnen und Schüler 
vor dem Hintergrund ihrer individuellen Merkmale das Feedback überhaupt wahr- 
nehmen und verarbeiten. Die Befunde zur differenziellen Feedbackwahrnehmung 
unterstreichen, dass das Feedback der Lehrkraft nicht von allen Schülerinnen und 
Schülern gleichermaßen wahrgenommen wird und dementsprechend nicht für alle 
Schülerinnen und Schüler wirkungsvoll ist. Die Herausforderung besteht darin, dass 
das Feedback von den Schülerinnen und Schülern als nützlich für den Lernprozess 
bewertet wird und das Bedürfnis nach Kompetenz erfüllt, also den Schülerinnen 
und Schülern das Gefühl gibt, den Lernprozess aus eigner Kraft verbessern zu kön- 
nen. Im Hinblick auf die unterrichtliche Praxis kann es zielführend sein, dass Lehr- 
kräfte ihre Schülerinnen und Schüler zur aktiven Beteiligung am Unterrichtsge- 
spräch motivieren, sodass möglichst viele ein individuelles Feedback erhalten kön- 
nen (Decristan et al., 2020). Hier bedürfen auch gerade Schülerinnen und Schüler 
mit ungünstigeren Lernvoraussetzungen besondere Aufmerksamkeit, da diese sel- 
tener im Unterrichtsgespräch beteiligt werden und entsprechend seltener von Feed- 
back profitieren (Decristan et al., 2020; Jurik et al., 2013). Zum anderen scheint es 
im Sinne einer individuellen Förderung im Unterricht allgemein darauf anzukom- 
men, dass Schülerinnen und Schüler unterschiedliche, an ihre Lernvoraussetzungen 
angepasste Rückmeldungen erhalten. Auch im Kontext der gymnasialen Oberstufe 
bestehen trotz erfolgter Differenzierung durch die Kurswahlen immer noch Leis- 
tungs- (Nagy et al., 2006; Trautwein et al., 2010) und Motivationsunterschiede (Bau- 
mert & Köller, 2000; Dreiling & Willems, 2020) zwischen den Schülerinnen und 
Schülern innerhalb der Kurse, sodass auch hier Lehrkräfte mit einer heterogenen 
Schülerschaft konfrontiert sind, die Feedback unterschiedlich wahrnimmt und ver- 
arbeitet. Hierfür müssen die unterschiedlichen Voraussetzungen der Schülerinnen 
und Schüler im Unterricht zunächst sichtbar gemacht werden. In diesem Zusam- 
menhang kann Feedback als dialogischer Prozess verstanden werden, der sich nicht 
nur von der Lehrkraft an die Schülerinnen und Schüler richtet, sondern auch um- 
gekehrt (Hattie & Zierer, 2018). Lernende können der Lehrkraft Rückmeldung dar- 
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über geben, auf welchem Leistungsstand sie stehen und wo die Verständnisprob- 
leme liegen. Das Feedback von Lernenden kann die Lehrkräfte dann im nächsten 
Schritt dazu nutzen, den Unterricht auf der Ebene des Lernprozesses und der 
Selbstregulation so anzupassen, dass die Lernaufgaben verstanden und bearbeitet 
werden können (Zierer et al., 2019). 

Ein solches adaptives Unterrichtshandeln setzt entsprechende diagnostische 
Kompetenzen der Lehrkraft voraus, mit denen Lehrkräfte die Unterschiede in den 
Lernvoraussetzungen von Schülerinnen und Schülern feststellen und ihr Feedback- 
verhalten darauf anpassen. Damit rücken die professionellen Merkmale der Lehr- 
kraft als eine Bedingung der Effektivität von Feedback in den Fokus (Besser et al., 
2017), weshalb das Thema Feedback in der universitären Lehrkräfteausbildung fest 
verankert sein sollte. Neben diagnostischen Techniken, einem vertieften Verständ- 
nis fachlicher Lerninhalte und -prozesse sollte dabei auch ein differenziertes und 
systematisches Wissen über verschiedene Formen von lernförderlichem Feedback 
und die wirksame Umsetzung davon im Unterricht vermittelt werden (Degeling, 
2019). Zu dem fachlichen, fachdidaktischen und pädagogisch-psychologischem 
Wissen kommt noch hinzu, dass es der Motivation bzw. Bereitschaft bedarf, die im 
Rahmen des Feedbackprozesses gewonnenen Informationen für die Weiterent- 
wicklung des Unterrichts zu nutzen (Degeling, 2019; Zierer et al., 2019). Außerdem 
kommen ausgeprägte Überzeugungen bezüglich des Potentials von einem lernför- 
derlichen (formativen) Feedback hinzu (Besser et al., 2015; Klieme et al., 2010). Im 
Bereich der Forschung zur Förderung professioneller Kompetenzen belegen die 
Ergebnisse die Wirksamkeit von Fortbildungen beim Aufbau des Wissens von 
Lehrkräften in Bezug auf Feedback (u.a. Besser et al., 2017). Weiterhin konnte im 
Rahmen des Forschungsprojekts ProFee das Potenzial einer (strukturierten) Vide- 
oanalyse zur Förderung der Handlungskompetenz von Lehramtsstudierenden beim 
Erteilen von Feedback demonstriert werden (Hess & Lipowsky, 2019). 

Schließlich scheint es vor dem Hintergrund der wachsenden Bedeutung von di- 
gital geprägten Lehr-Lernangeboten (Eickelmann & Gerick, 2020) wichtig, die 
Möglichkeit von digital gestütztem Feedback zur Verbesserung der Unterrichtsqua- 
lität und zur Förderung der Lernergebnisse stärker in den Blick zu nehmen (Wis- 
niewski, 2019). Eine Möglichkeit kann beispielweise darin bestehen, bestimmte For- 
men von Feedback (z.B. Informationen zur Richtigkeit) bei einer Aufgabenbearbei- 
tung an ein digitales Tool auszulagern, um so kontinuierlich und individualisiert auf 
die Schülerinnen und Schüler mit ihren unterschiedlichen Lernvoraussetzungen ein- 
gehen zu können. 
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B Feedback von Lehrkräften ist von hoher Bedeutung für die Lernentwicklung 
von Schülerinnen und Schülern. Für eine optimale Unterstützung der Lern- 
prozesse ist es wichtig, wie Schülerinnen und Schüler das Feedback wahrnehmen 
und nutzen. Ausgehend von theoretischen Angebots-Nutzungs-Modellen widmet 
sich das vorliegende Buch der Frage, inwiefern Schülerinnen und Schüler der 
gymnasialen Oberstufe das Feedback von Lehrkräften im Deutschunterricht 
unterschiedlich wahrnehmen und wie sich diese Wahrnehmung auf die Motiva- 
tionsentwicklung der Schülerinnen und Schüler auswirkt. Die Befunde aus Latent- 
Change-Modellen geben Aufschluss über die Stabilität und Veränderung der 
Feedbackwahrnehmung im Laufe eines Schulhalbjahres sowie zu Unterschieden 
in der Feedbackwahrnehmung zwischen Schülerinnen und Schülern. Darüber 
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Lernmotivation herausgestellt. Die Befunde erweitern den Forschungsstand zur 
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pädagogische Praxis. 
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